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PRÉFACE. 


Le présent fascicule contient la première partie de leçons 
données à la Sorbonfte au printemps de i() 35 . Il doit être suivi 
d’un ou de plusieurs autres fascicules, dont l’ensemble formera 
une introduction mathématique aux théories quantiques . 

Le présent fascicule expose, à partir des éléments, les propriétés 
des espaces vectoriels à n dimensions et de leurs transformations 
linéaires. Géométriquement, on obtient une théorie des opérateurs 
linéaires , qui se traduit analytiquement par une théorie des 
matrices . Le choix des coordonnées aptes à fournir la matrice la 
plus simple d’un opérateur déterminé conduit naturellement à la 
réduction des matrices , des formes qui leur sont attachées, et à 
l’étude du spectre . En géométrie affine on obtient ainsi les réduites 
de Jordan ; en géométrie métrique ou unitaire on obtient les 
réduites de Schur , et, lorsque la matrice est hermitienne , on a la 
réduite diagonale que Lagrange et Gauss avaient donnée pour 
les formes quadratiques. 

La matière de Y Introduction que nous préparons, se trouve déjà 
exposée, plus ou moins complètement, à des points de vue et sous 
des formes assez divers, dans plusieurs bons ouvrages, parmi 
lesquels nous citerons surtout : 

F. Riesz, Les systèmes d J équations linéaires à une infinité 
d’inconnues ( 1 9 1 3 ) ; 

H. Weyl, Gruppentheorie und Quantenmechanik { 1928); 

A. Wintner, Spektraltheorie der unendlichen Matrizen (1929); 

M. H, Stone, Linear transformations in Hilbert Space and their 
applications to Analysis (1932) ; 



VI 


PRÉFACE. 


J. von Neumann, Mathematischc Grundlagender Quantenmechamk 
(1932). 

La lecture des livres précédents nous a été fort utile en période 
d’élaboration de ces leçons ; utiles aussi le bel article de l’Encyclo- 
pédie allemande que l’on doit à MM. Helunger et Toeplitz, Inte - 
gralgleichungcn and Gleichungen mit unendlichvielen Unbekann- 
ten , et l’excellent Traité de MM. Courant et Hilbert, Methoden der 
mathematischen Physik. 

Il nous paraît cependant qu’à garder simultanément présentes 
à l’esprit la notion géométrique d’opérateur et les représentations 
diverses de cet opérateur, par des matrices correspondant aux 
divers systèmes de coordonnées offerts par la géométrie de l’espace 
étudié, l’exposition gagne en clarté et en simplicité. C’est dans ce 
sens qu’on a essayé de mener ici l’exposition et qu’on espère, par 
fusion du géométrique et de l’analytique, avoir réussi à éclaircir 
ou simplifier plus d’une démonstration et à faciliter Pacquisition 
des notions qui font l’objet de ces leçons. 

Ces leçons ont été faites à la demande de quelques physiciens, 
devant des physiciens et des mathématiciens. Pour les mathémati- 
ciens qui voudraient approfondir l’étude des questions envisagées 
ici, il est bien évident que notre livre n’est qu’une introduction à 
poursuivre l’étude des mémoires originaux, en tète desquels 
figurent les beaux mémoires de M. Hilbert, sur les équations inté- 
grales. 

Il m’est agréable de remercier ici M. Dufresnoy, élève de l’Ecole 
Normale Supérieure, qui a bien voulu rédiger ces leçons, et 
M. Winter qui, après avoir assisté à ces leçons, a bien voulu 
revoir et critiquer la rédaction « en physicien ». La maison 
Gauthier-Villars n’a rien négligé pour assurer à ce livre la 
meilleure présentation; qu’elle soit, elle aussi, chaleureusement 
remerciée. 


Gaston Julia. 
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I. — GÉNÉRALITÉS. 

1. L’origine des théories mathématiques se trouve dans l’étude de 
problèmes physiques. Il est, à première vue, surprenant qu’une théorie 
ainsi ébauchée, puis développée indépendamment de toute considéra- 
tion extérieure aux mathématiques, vienne par la suile rendre au 
physicien les plus grands services. C’est pourtant de cette façon que se 
construisent parallèlement la physique et les mathématiques. 

2. Les problèmes relatifs aux vibrations des systèmes conduisent à 
des équations différentielles et à des équations aux dérivées partielles; 
comme autre exemple de problème physique conduisant au même 
genre de questions mathématiques, on doit citer le potentiel électrique 
ou magnétique. La détermination d’un équilibre électrique, par 
exemple, nous conduit à rechercher les solutions de l’équation 

AU = o, 

U désignant une fonction d’un point de l’espace (fonction qui repré- 
sente le potentiel électrostatique), A désignant le laplacien 

ô 2 0* à* 

àx- dy- àz- } 

solutions qui doivent prendre des valeurs données sur des surfaces 
données. C’est le célèbre problème de Dirichlet. Plus généralement 
on sera conduit à la même question avec l’équation 

Aü=/, 
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f étant une fonction donnée ^par exemple, dans le problème précédent, 
pourra représenter une densité de charges électriques, imposées à 
l’avance^ • 


Pour le problème des cordes vibrantes, étudié depuis Bernoulli, 
d’Alembert etc., si l’on cherche à représenter l’élongation z de la corde 
tendue, par une fonction de la forme z = u(s). s étant l’abscisse 
et t le temps, z satisfaisant à l’équation 


()‘Z __ z 

dt 1 ds- 


(qui exprime que l’accélération de l’élcmcnt de corde d’abscisse s est 
due aiix tensions provenant des éléments voisins), on obtient 

d 2 U (P v 

c *dF v=zU dF’ 

soit 

i dïv(t) i __ d-u{s) i __ 
c 2 dt- v {t) ~~ ds 2 u(s ) 


X étant une constante indépendante de s et de /, ce qui conduit à l’équa- 
tion 


d- u 
~d?- 


-4- X U — O f 


dont on cherche les solutions u(s ) s’annulant aux extrémités de la corde. 
C’est ce problème des cordes vibrantes qui a conduit à la considération 
des séries de Fourier et à la théorie des systèmes orthogonaux de 
fonctions. 

Dans l’étude des vibration^ de membranes, on recherchera de même 
des solutions u(x, y) de l’équation 

\u h- X u = o, 

qui soient nulles sur le contour sans être identiquement nulles. 

Ces problèmes ne seront résolubles que pour certaines valeurs de la 
constante X, dépendant des extrémités de la corde ou du contour de la 
membrane. C’est évident pour la corde : soit X > o, on peut poser X = « 2 
et l’on obtient la solution 


u — A cos (os -h B sin ojs. 


Annulons pour s = o et s = l; il vient A = o, et si l’on veut avoir B ^ o 
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il faut sin co/ = o, soit co = ^ , X = A' 2 ~ » A 1 étant un entier arbitraire. 

Si A < o on aurait à considérer les cosinus et sinus hyperboliques; on 
verrait sans peine que le problème ne serait plus résoluble. 

Ces valeurs de X sont dites valeurs propres ou bien valeurs fonda- 
mentales , ou encore valeurs caractéristiques . Les solutions corres- 
pondant à de telles valeurs seront dites, de même, propres, fondamen- 
tales ou caractéristiques. 

Ce problème joue un rôle fondamental en acoustique et en spectro- 
scopie. La constante X reçoit une interprétation physique très importante : 
elle est proportionnelle à l’énergie du système en vibration, qui appa* 
raît ainsi comme susceptible de prendre uniquement des valeurs dis- 
crètes. 

3. Les problèmes dont il vient d’être question sont des problèmes 
linéaires ; cela veut dire que si l’on en a deux solutions, leur somme 
est une solution et que si l’on en a une solution, celle-ci multipliée par 
une constante quelconque est encore une solution. 

En physique on rencontre fréquemment de tels problèmes linéaires; 
cela tient moins à un fait physique qu’à la relative facilité de la résolu- 
tion de ces problèmes : ce sont presque les seuls que l’on ait étudiés. 

4. La démonstration rigoureuse de l’existence, et le cas échéant de 
l’unicité, de la solution de tels problèmes, ne s’appuyant pas sur des 
considérations physiques, est difficile et récente. Après Riemann, 
Neumann, Schwarz, Poincaré ont fait des travaux sur le problème de 
Dirichiet; pour les cordes vibrantes, la première solution satisfaisante 
date de Fourier, puis de Dirichiet; quant aux autres problèmes, la 
démonstration de l’existence de valeurs caractéristiques X a été partielle- 
ment faite par Schwarz (qui a mis en évidence la solution la plus petite), 
par M. Picard (qui a montré l’existence de la valeur caractéristique sui- 
vante), puis a été complètement réalisée par Poincaré (*). Fredholm 
a retrouvé tous ces résultats par une méthode différente. 

Considérons l’équation 

AU h- X U — o; 

on peut lui donner une autre forme, qui sera d’ailleurs entièrement 
équivalente lorsque le A de la solution existera. Considérons une distri- 
bution de matière, de densité pt, dans une certaine aire; elle crée un 


( l ) Voir Poincaré, Rendiconti del Circolo Matematicodi Palermo , 1894. 
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potentiel 

U(M)= / / iJL(P)log 

Hors des masses AU = o, tandis que dans les masses AU = — 27 T p 
diaprés la formule de Poisson. Rappelons, en passant, que l’on peut 
faire les mêmes considérations dans l’espace, mais on devra alors 

remplacer log —3 par et le coefficient de la formule de Poisson sera 

4 TT au lieu de 271. 

Soit alors à résoudre 

AU -h XU =/. 

Si Ton pose 

U(M)=y/V(P)l°8|ÿ î p^P, 

il vient 

AU ( M ) = — 2 wjji ( M ) =/( M ) — X U ( M ). 


D’où l’équation 

l!(M) ~ — '/|/,P)-XU(P) 1 log 5 j L^ > 


dont on est ramené à chercher une solution IJ ; avec les mêmes condi- 
tions de contour, ces deux problèmes sont équivalents; cette équation 
est une équation intégrale qui peut s’écrire 

f f K(M, P) U(P) nfip = F(M), 


dans laquelle U est la fonction inconnue. Remarquons que dans le cas 
particulier où /= o, on a 


F =-à/y> (p > ,o « 


MP 


rfvp - 


et nous retrouvons encore une équation linéaire. Si nous avons un 
second membre F, il est facile de s’assurer que la solution générale 
d’une telle équation est la somme d’une solution particulière et de la 
solution générale de l’équation sans second membre. 

Avec une seule variable, nous serions de même conduit à une équation 
du type 

o(s)~h\ f K (s, t) o(t) dt=/(s), 

J a 


dans laquelle <p est la fonction inconnue. La constante X s’introduira 
facilement si l’on part des cordes vibrantes; par contre, si l’on part du 
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problème de Dirichlet AU = o, et qu’on essaie' de le résoudre par un 
potentiel de double couche de densité inconnue p, tel que U, lorsqu’on 
s’approche du contour, tende vers les valeurs imposées au contour, on 
est conduit pour déterminer p à une équation du même type, mais ne 
contenant pas de Constante X. 

5. Fredholm a fait l’étude des équations 

O ?(0 dt =f(s), 

lorsque K ( noyau ) est une fonction continue de ses deux arguments et 
même dans des cas un peu plus généraux ( 1 ). 

Avant lui, Le Roux et Volterra avaient résolu la question dans le cas 
particulier où K(s, t) est nul lorsque l>s; l’équation intégrale s’écrit 
alors 

9(i)-+-X f K(i, 0?(0<*=/(0> 

** a 

et la méthode des approximations successives s’applique pour toute 
valeur de X : 

Çi (*) = /(*)-- Xjf K(j, /) 9 0 (t)de, 


9 n(s)=f(s)~l ( K($, t)o n -\(t)dt; 

J a 


cp n tend vers cp, solution de l’équation. Tandis que dans le cas envisagé 
par Fredholm la méthode ne réussit que si X est suffisamment petit : d’une 
façon plus précise, si | A | est inférieur au module de la racine de plus 
petit module de D(X) = o, équation que nous allons définir. 

Revenons aux travaux de Fredholm. Ils montrent qu’une valeur de X 
permet en général la résolution; la solution se présente sous la forme 

?(0 =/(*) — X f X(s, t\X)f(t)dt. 

JC(s, t\ X) étant une fonction que l’on sait calculer; on l’appelle noyau 
résolvant de K, et elle se présente sous forme d’une fonction méro- 

(*) Voir Fredholm, Acta mathematica, 1901. 




6 


APERÇU HISTORIQUE. 


morphe en X ou, d’une façon plus précise, comme quotient de deux 
fonctions entières 


X(\s, t; X) = 


DO, t ; X) 
D( X) 


La fonction D(X), que l’on appelle le déterminant de l’équation, se 
forme uniquement en connaissant K(s, t ); c’est à rapprocher de la 
résolution id’un système d’équations linéaires : on sait que le déterminant 
du système ne dépend que des premiers membres. Plusieurs cas sont 
possibles : 

i° Si X n’annule pas D(X), une solution et une seule (rapprocher du 
système de Cramer d’équations linéaires). 

2 ° Sinon, que fait-on dans le cas du système d’équations 

k 

On considère les premiers membres; on cherche les formes linéaire- 
ment indépendantes et les relations linéaires existant avec les autres 
formes, c’est-à-dire les systèmes de nombres X ( -, non tous nuis, satisfai- 
sant à 

(0 2 h<*tk = °, 


pour tous k, et, par application du théorème de Rouché, on en déduit 
que la condition nécessaire et suffisante pour que le système présente 
des solutions est qu'il existe entre les seconds membres toute combi- 
naison linéaire qui existe entre les premiers , soit 

(2) 2 - °> 

i 

pour tous les systèmes X/ de valeurs précédemment trouvés. 

Ici, au système transposé (i) correspond V équation homogène 
associée 

% b 

ç(«)-+-X/ KO, s) ç( t) fit — o. 


De même que le système (i) présentait toujours un nombre fini de 
solutions linéairement indépendantes, cette équation présente toujours 
un nombre fini de solutions 


?», ?2, ?k f 

linéairement indépendantes. 
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De même que Péquation (2) exprimait que le vecteur Y de compo- 
santes y f , y^ . . . , y n était perpendiculaire à tous les vecteurs A de 
composantes À,, Ki c’est-à-dire, d’une façon abrégée, que le 

second membre doit être orthogonal aux solutions du système trans- 
posé, on trouve ici, comme condition nécessaire et suffisante pour que 
l’équation intégrale ait des solutions, que / soit orthogonal à <p w 
cp.j, . . . , cp/„ c’est-à-dire 


r b 

J 9i(t)f(t)dt = o pour 


* = 1, 2, 


II. — PREMIÈRE MÉTHODE DE HILBERT. 

1 . Quelque temps après Fredholm, Hilbert a repris la question à un 
double point de vue algébrique. Considérons sa première méthode. 
Elle nous montre le parallèlisme du problème avec celui des équations 
linéaires. 

Nous nous proposons de résoudre 

?(*)-+- X f K($, t) 9(0 <*=/(*)• 

Le premier membre de cette relation est une fonctionnelle de la 
fonction 9, que nous désignerons par t£(<p), c’est-à-dire une expression 
que nous saurons calculer si nous connaissons la fonction 9 ; c’est donc 
là une généralisation de la notion de fonction. Cette fonctionnelle est 
linéaire , c’est-à-dire que l’on a 

S(a 9 )=aS(ç), 

si a désigne une constante et 

«(9i -^92) = *(Çi) + «(?i). 

Nous allons évaluer le premier membre d’une façon approchée en 
remplaçant l’intégrale par une somme; à cet effet nous diviserons 

l’intervalle a6, en intervalles partiels de longueur à = ^ ■ - - - ? par les 
points x o, . . . , x n . Nous aurons alors la relation approchée 

?(*)•+■ ^2 K ^’ ti ï s= /( f ) (*<= *')> 

i 

relation qui sera en particulier vérifiée lorsque nous donnerons à s les 
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valeurs . . . , x n ; d’où les relations 

M ?(*/)* =/(*/) P our y = i,a, (*/ = .*/). 

t 

Si nous posons 

?(*/) = ?/> 

8K(# ; , f < ) = K /i , 

/( */ ) = // » 

ces relations prendront la forme 

?/ ■+■ K/,? ' = //> 
i 

soit, avec les notations développées, 

(i -4- A Kl, )9i -+- ÀK| 2 Ç 2 4- . . . -f- XK,* 9 n=fit 

X K.21 X Kîrt o n — ,/*S) 

? 

XK„, -h XK, 12 92 -+■• • .4Mi -4- XK nn ) 9„ —fn* 

Les <pi sont ainsi déterminés par iin système d’équations linéaires; nous 
avons donc calculé la valeur approchée de la fonction <p en n points 
intermédiaires de l’intervalle ab. 

Cette idée très simple, employée par Hilbert, s’était montrée féconde 
pour d’autres problèmes importants; elle est, en effet, à rapprocher de 
la méthode de Cauchy-Lipschitz pour les équations différentielles 

!;=/(*,/), 


ou, plus simplement encore, de la recherche des primitives d’une fonc- 
tion en appliquant la méthode précédente à 


dy 

dx 


= /(*)■ 


Pour pouvoir résoudre le système linéaire d’une façon unique, il faut 
que 


A(X): 


i ■+• X K 1 1 

xk 12 .. 

XK,„ 

xk 21 

I -H X K s2 .. 

XKo/i 

XK., 

XK„ S .. 

i *+■ X K„„ 


soit différent de zéro. 
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Si celle condition est réalisée, les solutions seront données par les 
formules de Cramer 

A/1/1 H- A. lift H- ... H- A in.fn 

?, = - £ ’ 

en désignant, suivant l’habitude, par A/* le mineur, affecté d’un signe, 
du terme de la f ,6me ligne et de la A ,,ème colonne dans le déterminant À. 

Cette méthode comprend maintenant un deuxième temps qui est le 
passage à la limite : il faut s’assurer que, lorsque n tend vers l’infini, les 
quantités yi = 9 / relatives à x=zxi déterminent une courbe limite qui 
est solution de l’équation fonctionnelle. Hilbert (<) l’a fait lorsque le 
noyau K est symétrique et a retrouvé les résultats de Fredholm; dans 

ce cas particulier, si l’on pose X — — -j , l’équation A (À) — o prend la 
forme de l’équation en s d’une quadrique ayant pour équation 

K pqXpXq — O, 

!>><! 


2. C’est donc du déterminant A que l’on peut déduire si le problème 
admet une solution unique, ou s’il est impossible ou indéterminé; c’est 
donc le premier membre de l’équation fonctionnelle qui règle le 
problème. Les racines de l’équation A(X) = o tendent vers les zéros du 
déterminant D (X) de Fredholm ; elles formeront donc le spectre de valeurs 
propres . 

Soit la forme quadratique symétrique 

(1) K ijXiXj', 

à une racine X* de l’équation A(X) = o correspond une solution 

fN / 1 / 

Vl) ? 2 > • •• J 9 /n 

soit <£', qui est unique si X est racine simple ; à deux valeurs distinctes Xj 
et X 7 de X correspondent des solutions orthogonales , c’est-à-dire telles 
que 

(2) 2 çi? y t = o- 

k 

Si l’équation en X présente une racine double, il y aura plusieurs solu- 
tions qui forment une multiplicité et l’on prendra deux vecteurs indé- 


(*) Voir Hilbert, Gôttinger Nachrichten , 190^. 
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pendants dans la multiplicité ; on pourra les choisir orthogonaux 
(d’après Schmidt). 

On obtient donc finalement un système de vecteurs $ orthogonaux 
deux à deux; on peut leur donner une longueur unité, autrement dit les 
normer. Alors, par le changement de variables, 


(3) 


=?l7i .-+-?Ï7*> 


= ?«7 1 2 "H ... *+- ÇÎI7/I, 


qui revient à prendre les <É> comme nouveaux axes, la forme quadratique 
devient 



i 


et les anciens coefficients de la forme quadratique 


(4) 



On le vérifiera immédiatement par la transformation inverse 

< 5 ) 

h 


Ces résultats se généralisent et s’étendent lorsque n devient infini. La 
forme quadratique (i) est remplacée par 


<0 


// 


K(», t)x(s)x(t) ds dt . 


A “Kl , solution de D(À) = o, correspondra une fonction solution du 
système homogène associé (si li est racine multiple, il y aura plusieurs 
<P i que l’on pourra choisir orthogonales). Ces fonctions seront ortho- 
gonales deux à deux, et, après les avoir normées, on aura 


(*') 

avec 


Si l’on pose 

(5') 


/' 

•J a 


?i?/ dt = S, 


tj> 


àij — O si i ^ y, 

S// =; I si i = y. 


7a = /* ?*</)«( O 

J a 


dt, 



APERÇU HISTORIQUE. 

on peut démontrer que (i') deviendra 


( 3 ') 


* 

2 


yl 


i 


U 


et que K(.y, t) pourra se développer, en fonction des solutions fonda- 
mentales, par 

K(«, 

i A/ • 

Si K n’était plus symétrique, au lieu d’envisager une forme quadratique, 
il faudrait envisager une forme bilinéaire qui ne peut pas toujours se 
ramener à une forme canonique si simple (Jordan). 


III. - DEUXIÈME MÉTHODE DE HILBERT. 

1. Hilbert transforme le problème de Fredholm, et le ramène à la 
résolution d'un système d'une infinité d' équations linéaires à une 
infinité d'inconnues. Cette méthode, reposant sur la considération de 
systèmes orthogonaux de fonctions, peut être suggérée par les séries de 

Fourier qui s’introduisent dans la résolution de l’équation ~~ 4-Xa= o 

dont nous avons déjà parlé. Donnons quelques explications prélimi- 
naires. 

On dit qu’un système de fonctions <p; est orthogonal et normal dans 
l’intervalle «6, si 

/ <?t(x)o k {x)düc = B iky 

a 

avec 

S** = o si i k ( orthogonal ); 

§ik~ i si i = k {normal). 

Comme exemple, nous pouvons citer le système de Fourier : 

i, cos#, sin#, ..., cos /i#, sin nx, ...; 

dans l’intervalle (o, arc), ces fonctions sont orthogonales; il suffirait de 
les multiplier chacune par une constante convenable pour les normer. 
La notion de fonctions orthogonales est l'extension de celle de vecteurs 
orthogonaux , l’intégrale ayant remplacé la somme 

p 
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Dans certaines conditions assez générales, une fonction / peut se 
développer en série de la forme 


ceci pouvant se rapprocher d'une égalité vectorielle, le vecteur / étant 
décomposé en ses composantes suivant les vecteurs <p 0 , , <p w , .... 

Dans le cas des séries trigonomé triques, Jordan a démontré que si /est 
une fonction à variation bornée (c’est-à-dire une fonction qui peut 
se mettre sous forme de la différence de deux fonctions croissantes et 
bornées), elle est égale à la série en tous les points où elle est continue 
(une telle fonction n’a d’ailleurs qu’une infinité dénombrable de points 
de discontinuité) ; et qu’en un point de discontinuité x , la série a pour 

somme ^ [/(# -f- o) — o)]. On prouve aisément ce résultat dans 

le cas particulier où / est continue et présente une dérivée. Mais Fejer 
a montré que même dans le cas élémentaire où / est continue, elle peut 
avoir une série de Fourier divergente. 

Dans tous les cas, on peut se proposer d'approcher y t , par une combi- 
naison linéaire des n premières fonctions du système; pour mesurer 
V approximation on peut utiliser, par exemple, le maximum de 

I /— «o?o — «I ri —••• — On ?„ I, 

ou bien la valeur de 



— < 7 0 ? 0 — a, 9 1 — . . anVnY àx. 


Si nous appliquons la première méthode d’approximation à l’un des cas 
signalés par Fejer, le maximum & n tend bien vers zéro lorsque n aug- 
mente indéfiniment, mais les déterminations successives, pour les 
diverses valeurs de n, des coefficients a 0 > . .. d’indices donnés 

varient et ne tendent pas vers des limites; on ne peut donc pas obtenir 
une série convergente de somme /. 

Prenons la seconde méthode d’approximation; il faut chercher les ai 
rendant l’intégrale minima ; annulons les dérivées partielles par rapport 


aux ai : 


c’est-à-dire 


I (/ — «o?0 — #l?t — ••• — &n 9n) ?i “ O, 
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en tenant compte du fait que les fonctions <p sont orthogonales et 
normales. L’approximation réalisée est alors 


J f (/— «oro — çi — . . a n o n )-dx 

a 

= f fîdx — /ç/ dx +2^a i ajJ' ?/ ?y dx -h^ af J ?/* dx 

=f f-dx-^a'}. 


i*i 


D’où la relation, due à Parseval, 


f f 1 dx — af ^ o, 


qui est vérifiée quel que soit n\ donc la série 2a? est convergente et 
l’on a 

°C (j 

^, a i = f f' ldx ' 

îtr 0 J(l 

Si l’on peut approcher arbitrairement de toute fonction /, le système de 
fonctions cp est dit complet et l’on a l’égalité 


J f-(x) dx — ^ a ‘t . 


Revenons à nos comparaisons vectorielles. / f' 2 (æ)dx exprime le 

d a 

carré de la longueur du vecteur f\ donc l’égalité de Parseval corres- 
pond au théorème de Pythagore. Plaçons-nous dans l’espace ordinaire 
à trois dimensions; si l’on a les projections d’un vecteur Y sur trois 
axes perpendiculaires, on a l’égalité 

| V|* = X»-*- Y*-+-Z*; 


si l’on ne dispose que de deux axes perpendiculaires, 

|V|*£X»-hY*. 

Notre système de deux axes est incomplet ; on peut le compléter par 
un troisième axe perpendiculaire aux deux premiers; tandis que lorsqu’on 
a trois axes perpendiculaires, on ne peut en trouver un quatrième qui 
leur soit perpendiculaire : le système est complet . De même, pour un 



H 
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système complet de fonctions orthogonales, les égalités d’orthogonalité 


J* $i$dx = o, 


quel que soit i, entraînent $ = o. 


2 . Hilbert transforme le problème de l’équation intégrale et le 
ramène à la résolution d’une infinité d’équations linéaires à une infinité 
d’inconnues. Dans l’aperçu que nous allons donner, nous n’aborderons 
aucune des questions de convergence qui se présentent. 

Nous supposerons que la solution 9 peut se développer dans le système 
orthogonal 9; de fonctions, soit 

90 

i — 0 

avec 

r b 

a i — ! 


Les ai sont dits coefficients de Fourier de 9 dans le système <p,. Si la 
solution n’était pas développable, il y aurait peu de choses à changer, car 
on pourrait l’approcher arbitrairement avec une combinaison linéaire 
des 9;. Soit l’équation intégrale 

0(5) -h a / K(s, t) o(t) dt = f(s). 

d a 


Nous avons, en permutant les signes J et ^ sans s’inquiéter de la 


rigueur 


A J* K(s J t)y(t)dt=z\j' K(s, t)^^ a iYi(J) dt K (s, t)<fi(t) dt. 

a a 1= 0 /=o a 

Mais remarquons que 

J K(*> t)çi(t)dt = K/(i) 


n’est autre qu’un coefficient du développement de K (s, t) considérée 
comme fonction de t . L’équation prend la forme 

00 

?(*)■+• Kt( ' s ' )a ‘ =/(*)• 

* = 0 
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|La série obtenue est convergente, car 2 KJ et la] le sont d'après la 

relation de Parsevai et K t *ai< . j 

Nous pouvons maintenant développer les deux membres de notre rela- 
tion, ou, si l’on préfère, les multiplier par 9; et intégrer de a à 6; il 
vient 

(S) aj+ — pour J = i, 2, . . . , n, . . . , 

en posant 

*//= / K,(*)?/(*)^» 

qui est donc une intégrale double de K (s, t) et l’on a une relation ana- 
logue à celle de Parsevai : 

J J K Hs,t)dtdt. 

i,i 

Si V équation intégrale a une solution 9, des coefficients a t de son 
développement satisfont au système linéaire (S). Réciproquement , 
si Von a une solution ai de (S) et si la série la} est convergente , il 
lui correspond une solution 9 de V équation intégrale. 

Dans le cas particulier où K(s, t) est un noyau dégénéré ou noyau 
de Goursat, c’est-à-dire où il peut s’écrire 

K($, t) = S t Ti -h SîT 2 -+- SjTj, 

Si étant une fonction de s et T* une fonction de le système (S) se 
réduit à un nombre fini d’équations. Cette méthode permet de traiter un 
noyau quelconque par passage à la limite. 


3 . Nous sommes donc conduits à nous demander dans quelles condi- 
tions le système (S) présente des solutions et si les résultats obtenus pour 
un nombre fini d’équations à un nombre fini d’inconnues se conservent. 
Ces problèmes et d’autres connexes ont été étudiés par Hilbert et ses 
élèves (Hellinger, Toeplitz, Hilb, F. Riesz, Haar, H. Weyl, etc.); les 
résultats de cette étude constituent la géométrie de l’espace de Hilbert, 

«P 

On a d’abord fait la théorie des formes linéaires ^ l p x p dans le cas 

/>=0 

particulier où la série 2Ç est convergente (la forme est alors dite 
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complètement continue) et en envisageant les valeurs de$ variables 
rendant ix* p inférieur ou égal à i . Puis les formes quadratiques complète- 
ment continues (cas où la série 2k*j est convergente); on démontre que 
ces formes peuvent se ramener à la même expression canonique que 
celles à un nombre fini de variables; à cet effet on les tronque, on 
cherche les valeurs caractéristiques des formes tronquées et leurs limites 
lorsque le nombre des termes considérés augmente indéfiniment; ces 
limites sont les valeurs caractéristiques de la forme quadratique et parle 
changement linéaire correspondant de variables, on obtient la forme 
canonique 



Dans le cas de la continuité complète, il y a donc un parallélisme 
absolu. 


Hilbert a aussi étudié les formes quadratiques ^ k pq x p x q dites 

P,q-\ 

n 


bornées. Ce sont celles pour lesquelles les formes tronquées ^ kpqXpXq 

P,9 = i 

restent, quel que soit n , inférieures en module à un nombre fixe M lorsque 
le point (x { , . . . , x n ) décrit la sphère de rayon i (x'\ -f- x\ + . . . + x\ — i ). 
Les formes complètement continues sont bornées. La réciproque n’est 
pas vraie. Pour les formes bornées, en général, et pour les systèmes 
linéaires dont les premiers membres sont leurs dérivées partielles par 
rapport les problèmes de valeurs propres, de représentation 

canonique, de résolution, etc., sont bien étudiés. La forme canonique 



ne suffit pas. Il faut y ajouter une intégrale de Stieltjes provenant 


du spectre continu de la forme, lequel n’a rien de commun avec 
le spectre ponctuel qui s’introduisait pour les formes complètement 
continues. 

Parallèlement à la théorie des formes linéaires et quadratiques, à une 
infinité d’inconnues, on développe la théorie des matrices associées 
(matrices ayant pour éléments les coefficients de la forme) et ces deux 
méthodes trouveront leurs applications en physique. 

Les faits nouveaux (spectre continu) révélés par l’étude des formes 
bornées ont eu leur répercussion dans la théorie parallèle des équations 
intégrales singulières où le noyau n’est plus un noyau de Fredholm. 
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IV. — LA GÉOMÉTRIE DE L’ESPACE DE HILBERT. 

1. Sous l’influence des travaux, précédents s’est développée la 
géométrie de l’espace de Hilbert. On peut la présenter sous la forme 
d’une géométrie analytique. On dira que les quantités a,, a 2 , . 

. . . définissent un point P de l’espace de Hilbert si la série 2 | a | a 
est convergente. 

E. Schmidt a généralisé les propriétés de l’espace vectoriel à l’espace 
de Hilbert. 

F. Riesz a mis sous forme fonctionnelle la géométrie de l’espace de 
Hilbert en introduisant l’intégrale de Lebesgue (•); à toute fonction à 
carré sommable correspond un point de l’espace de Hilbert par l’inter- 
médiaire d’un système orthogonal, normé et complet de fonctions. Riesz 
et Fischer ont démontré qu’il y avait correspondance biunivoque entre 
les fonctions à carré sommable et les points de l’espace de Hilbert, c’est- 
à-dire que réciproquement, à tout système de nombres a, tel que la 
série 2 | a t | a soit convergente, correspond une fonction à carré sommable 
définie presque partout ^autrement dit partout, sauf, peut-être, sur un 
ensemble de points de mesure nulle; ce qui n’a d’ailleurs aucune impor- 
tance, car la fonction n’intervient que sous le signe ^ j* Comme exemple 
d’application, la relation entre les fonctions f et cp déterminée par 

r b 

f( s) = z(s ) \ J K (s,t)ç(t)dt 

' a 

correspond dans l’espace de Hilbert à la tranformalion linéaire entre 
les coordonnées / et f et x de <p, définie par 

fi — #/-+- kjjXj, 

i 

soit 

k 

avec convergente. 

On peut alors chercher les invariants de cette transformation, puis la 
forme canonique de celle-ci. La résolution d’une équation de Fredholm 


( l ) Une fonction intégrable au sens de Lebesgue est dite sommable. Le carre d’une 
fonction sommable est sommable, mais la réciproque est fausse; le produit de deux 
fonctions à carrés sommables est à carré sommable (inégalité de Schwarz). 


J U MA 
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et celle d’un système linéaire à une infinité d’inconnues correspondent à 
l 'inversion d’une transformation linéaire. 

Sous cette double forme [«) géométrie analytique (point de vue algé- 
brique des formes et des matrices, bornées ou non); b) résolution des 
équations intégrales, étude de leurs valeurs caractéristiques, etc.], le 
passage de l’une à l’autre pouvant s’effectuer comme l’ont montré 
F. Riesz et Fischer, la géométrie de l’espace de Hilbert a fait depuis 
trente ans de considérables progrès. Sous la seconde forme, l’étude des 
équations intégrales singulières , de leurs spectres continus, etc., pour 
des noyaux très généraux, a fait, entre autres, l’objet de profonds travaux 
de T. Carleman (voir Sur les équations intégrales à noyau réel et 
symétrique , Upsal, 1928; voir aussi Confèrence du Congrès de 
Zurich , 1932, pour une vue d’ensemble). Pour les travaux de Hilbert 
et de ses élèves, voir notamment Hellinger-Toplitz ( Integralglei - 
chungen und Gleichungen mit Unendlichvielcn Lnbekannten , 
Teubner, 1928). 

Cette étude trouve son application en physique dans la théorie des 
quanta. D’où un nouvel intérêt, qui suscite d’importants travaux; mais 
les représentations analytiques deviennent de plus en plus compliquées. 
Alors von Neumann envisage ces questions d’un point de vue différent. 

2 . A l’exemple de ce que, par exemple, Hilbert a fait pour l’espace 
euclidien (*), von Neumann construit axiomatiquement l’espace de 
Hilbert et en déduit des conséquences intéressantes sur les transforma- 
tions linéaires, bornées ou non de l’espace de Hilbert. Sa méthode, 
très intuitive et maniable, est peut-être moins puissante que celle de 
Carleman; de même la géométrie élémentaire est moins puissante que 
la géométrie analytique, mais, sur des questions simples, elle donne des 
solutions moins compliquées. Dans sa voie abstraite, il semble que 
von Neumann ait été guidé par F. Riesz qui, dans un Mémoire intéres- 
sant des Acta, démontrait le théorème de Fredholm dans tous les cas 
où la fonctionnelle satisfait simplement à la condition 

«(?)<A|ç|, 

A désignant une constante. 


( l ) Voir Hilbert, Grundlagen der Geometrie. Comme précurseurs il avait eu Lie, 
Helmhoitz et même Euclide. 
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V. — PROGRAMME DE CES LEÇONS. 

Voici maintenant le programme que nous allons suivre : 

a . Les transformations linéaires dans V espace à n dimensions; 
nous étudierons parallèlement la résolution des équations linéaires, le 
calcul des matrices, la réduction des formes quadratiques et hermi- 
tiennes; en passant, les équations linéaires seront étudiées sans déter- 
minants par une méthode qui peut se généraliser à une infinité 
d’inconnues; les valeurs caractéristiques d’une forme quadratique seront 
caractérisées par des propriétés d’extremum, en les rattachant à l’équa- 
tion en s relative à la recherche des directions principales d’une 
quadrique : le plus grand X (plus grand axe) correspond au maximum 
de la forme quadratique, le X immédiatement inférieur au plus petit des 
maxima des rayons vecteurs d’une section plane à n — i dimensions pas- 
sant par le grand axe — autrement dit satisfaisant à une relation 
linéaire — le suivant au plus petit des maxima des rayons vecteurs 
d’une section plane à n — 2 dimensions satisfaisant à deux relations 
linéaires, et ainsi de suite... 

b . Nous étendrons à l’espace de Hilbert à une infinité de dimensions 
les résultats obtenus sur les équations linéaires; puis nous étudierons 
les formes linéaires, bilinéaires et quadratiques complètement conti- 
nues, les formes bilinéaires, quadratiques, hermitiennes bornées, et 
parallèlement les matrices correspondantes. C’est une étude algébrique 
des transformations ou opérateurs linéaires de l’espace de Hilbert. 

c. Parallèlement à 6, nous étudierons les équations intégrales régulières 
correspondant à des noyaux bornés . 

d . Nous étudierons la théorie axiomatique des espaces de Hilbert; les 
opérateurs hermitiens bornés ou non; les équations intégrales régulières 
ou singulières. 

En somme, après un préambule a, nous présenterons parallèlement, 
en b } c, cf, sous sa double forme, analytique (algébrique ou fonction- 
nelle) ou axiomatique , l’étude, que nous allons entreprendre, des trans- 
formations ou opérateurs linéaires dans V espace de Hilbert . 
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I. — RAPPEL DE RÉSULTATS CONCERNANT LA RÉSOLUTION ET 
LA DISCUSSION DES SYSTÈMES D ÉQUATIONS LINÉAIRE6 
PAR LA MÉTHODE DES DÉTERMINANTS. 

1. Nous allons d’abord rappeler rapidement la théorie classique de la 
résolution d’un système linéaire, en utilisant les déterminants; nous 
montrerons ensuite que l’on peut faire disparaître ceux-ci des résultats, 
et enfin nous donnerons une autre méthode d’étude, indépendante des 
déterminants, qui sera susceptible de se généraliser au cas d’un nombre 
infini d’équations. 

Soit d’abord un système de n équations à n inconnues : 


(TN) 


«t! X\ -f- «12 Œi -+- . . . -h «i n &n — J'i j 
X\ - 4 “ #2Ï ^ 2 ... -h fl 2n X n — y + ^ 


«ni ■+* ClniX^-\- . . . -+* Cl nn X n — y n j 


et nous supposerons, en premier lieu, que le déterminant formé par les 
coefficients des inconnues n’est pas nul : 



«u 

«12 

. . «in 

A = 

«st 

«22 • < 

■ • U in 


Uni 

Un* 

• • U un 


= I a t k I 5 * o. 


Nous désignerons par A, * le complément algébrique ou mineur affecté 
d’un signe [( — i) i+A ] du terme aïk dans le déterminant A; A,* sera, si 
l ! on veut, défini par la relation 


Am — 


àl 
à a a 


D’après la règle du développement d’un déterminant par rapport aux 
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éléments d’une colonne, nous aurons 

n 

A = Ai jaij -+- A 2/ - a*j -h ... - 4 - k n ja n j A //a//. 

i = \ 

Si, d’autre part, nous considérons la somme 

n 

Aly*«l*-+- A 2 / « 2 *-+- A;,/a 7 lX:=^^ ktj&ik) 


dans laquelle j est différent de k, elle représente le développement d’un 
déterminant qui se réduit de A en remplaçant la y lèmc colonne par 
la k iém * ; ce nouveau déterminant ayant deux colonnes identiques est 
nul; nous pouvons donc écrire d’une façon générale 

2 A. 


Multiplions alors la première équation du système (N) par A,*> la 
deuxième par A 2 a, . . . , la /i ièine par A n * et ajoutons; il vient, en tenant 
compte de la relation que nous venons d’établir, 


A** =2 

i 

soit, puisque A n’est pas nid, 



i 


Nous obtenons ainsi les formules, dites de Cramer, qui nous donnent, 
en supposant son existence , la solution du système (N). Pour être 
rigoureux, il faut reporter ces valeurs dans l’une quelconque des équa- 
tions et montrer qu’elle est satisfaite; par exemple prenons la première 

2 "**2 ^K' yi=zy '’ 

k 

ou bien 

2*2^ 

i k 

2^ <8 a =y<’ 

i 

elle est bien vérifiée. 

Nous avons donc démontré que, si A est différent de zéro, le 
système (N) a une solution et une seule quels que soient les seconds 
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membres . Cette solation est linéaire par rapport à ceux-ci; attribuons- 
leur maintenant' des valeurs particulières : 


Y<D, soit y \ { } = 

«. /‘î’ = 0, 

1 = 0, . . . 

•> /« 1 = 0, 


qui donne la solution 





X»>, soit x " 1 = ^ , 

1 A 

~m_ èîî. 
- X’ 

II 

nr 

• ■ • » Al 1 = 

TT 

Y< 2 ), soit y ( i 2) — 

0, = t, 

/■y = °, .. 

O 

II 

K 


qui donne la solution 





X(*i, soit *(.»)= übl, 

A 

II 

iT :> - ^ » 

.... 2 ) 

J ^/l 

A 


de même Y (4 >, et enfin 

Y(»), soit y\ n) = o, y { 4 l) = o, y\' n - o, . . . , y^ = o, /,' l) = i, 

qui donne la solution 

Xt n >, soit = ~~ j x^ l) — j x[{ l) = j • • • y 


^ n,/i- 




Avec ces solutions particulières, que nous appellerons solutions élémen- 
taires, nous formerons immédiatement la solution générale relative à un 
second membre quelconque 

Y, soit y i, .... y n , 

que nous écrirons symboliquement 

Y = y x YU) +/J( Î ) + ... + y„Y(«). 

Celte solution sera 


X, soit x x = y £ À x\ i) y i , ^ 2 = 2^2 ) 7o •••» = ^ a? » > 7n 

f * * 

que nous écrirons symboliquement 

X = /tXd) -h y t XW . .-h 7nX<">. 

Remarquons que c’est là une forme classique de solution générale 
dans un problème linéaire ; par exemple : recherche d’une solution de 
l’équation AU = o qui prenne sur des surfaces données des valeurs cons- 
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tantes données (problème de Dirichlet en physique, problème de 
l’équilibre électrique). On prend pour constantes successivement 1 sur 
chaque conducteur et o sur tous les autres et l’on obtient ainsi les 
solutions .élémentaires ; la solution cherchée est 

i 

les yi étant les constantes données (ce sont les potentiels dans le cas de 
l’équilibre électrique). 

Remarquons encore que si nous donnons une valeur nulle aux 
seconds membres, les formules de Cramer nous montrent que le système 
présente uniquement la solution o. 

2. On dit que r formes linéaires /*, / 2 , sont linéairement 

dépendantes si l’on peut trouver r constantes X*, X 2 , . . X,., non toutes 
nu lies , telles que 

( i) X|/i -h X 2 f l H- ... -I- X rfr = O. 

Dans le cas contraire, les r formes sont dites linéairement indépen- 
dantes. 

Nous allons montrer que, quand A n’est pas nul, les n formes consti- 
tuant les premiers membres de (N) sont linéairement indépendantes; en 
effet, développons la condition (i) : 

o, 


o. 

Nous obtenons ainsi un système homogène (H') dont le tableau des 
coefficients des inconnues se déduit de celui du système (N) par permu- 
tation des lignes et des colonnes; (H') est dit système homogène trans- 
posé de (N). Son déterminant est égal à A (car on ne change pas la 
valeur d’un déterminant en permutant lignes et colonnes), donc 
différent de zéro et, d’après une remarque déjà faite, ce système 
homogène ne présente que zéro comme solutions : 

Ai = O. 

Les formes sont linéairement indépendantes. 

Nous venons de démontrer qu’une condition suffisante pour que n 
formes linéaires à n variables soient linéairement indépendantes est que 


(«') 


X I a 1 1 -+- X 2 Cl 2 1 -H . . . 
X 1 Cf 1 -2 -4“ X 2 (l-i* 


■ X,i««! ■ 

■ X/j Cln2 '■ 


X i rt i /i Xod./i - 


‘ "^nU/in — 
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le déterminant de leurs coefficients ne soit pas nul; nous verrons qu’eHe 
est nécessaire. 

3. Nous nous plaçons toujours dans le cas d’un système de n équa- 
tions à n inconnues, mais nous supposons maintenant que le déterminant 
A est nul. Considérons, parmi les déterminants extraits du détermi- 
nant A, ceux qui ne sont pas nuis; à moins que les coefficients aa ne 
soient tous nuis, ces déterminants existent (pour s’en assurer, il 
suffît de prendre ceux d’ordre i réduit à un coefficient non nul); les 
ordres de ces déterminants sont tous inférieurs à n , ils présentent donc 
une borne supérieure p qui est inférieure à n. Le nombre entier p est 
appelé le rang du système. En changeant les indices des formes et les 
indices des variables, nous pouvons toujours supposer que le déter- 
minant 

«il a | 2 ... a ip 

^ ci** ... dto 

o = ’ r 

dpi dp* ... €lpp 

n’est pas nul; nous l’appellerons déterminant principal* les p premières 
équations seront les équations principales , et les p premières inconnues 
les inconnues principales. Ceci entraîne comme conséquence que les 
formes f s . / 2 , . . . , / p sont linéairement indépendantes, car dans le sys- 
tème en X on obtient la solution zéro (en ne tenant compte que de l’iden- 
tification relative aux p premières variables). Montrons maintenant que 
chacune des autres formes est une combinaison linéaire des p premières; 
en effet, le déterminant 


a u 

ai* 

. . . a t p 

dlpJrh 

a* i 

a** 

. . • a*p 

a>*p-\-h 

dpi 

dpi 

... a p p 

a p p+/i 

^p-f-i,i 

®p-t- 1,2 

... dp+i t p 

rt p+i,p+/< 


est nul, si h est négatif ou nul parce qu’il a deux colonnes identiques, si 
h est positif en raison de la définition même du rang p. Développons 
ce déterminant par rapport aux éléments de la dernière colonne 

X 1 *+* Xg #2,p 4-/l ■+■••• ■+* Xp+1 a pn-1 ,p4-/| = o. 

Les X s’obtiennent à l’aide des p premières colonnes, donc ne dépendent 
pas de h ; d’où la relation 

Xl/l -+* X 2 y* s -H ... -4- Xp/p H- Ap-f-t/p-n = o, 
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car là relation obtenue plus haut entre les a montre que chaque 
inconnue x a son coefficient nul. Mais = à ÿé. o; nous pouvons donc 
écrire 

/p+i = a il/l •+* a i tfi "+“•••-+* a lp/p* 

Nous obtiendrions de même 

/p+/ = */i /i + */î/î + • ■ • + «/p/p avec l > o. 

Nous pouvons donc dire que le rang p du système est le nombre maxi- 
mum de formes linéairement indépendantes choisies parmi les 
(C'est un exemple de définition dans laquelle nous avons fait disparaître 
l'expression : déterminant.) 

La condition nécessaire et suffisante pour que les n — p dernières 
équations (N) soient vérifiées lorsque les p premières le sont est qu’entre 
les seconds membres existent les relations 


y ? +l = a/1/i -H ait r-2 -H ... -H a/p/p- 


Dans la théorie avec déterminants on met ces équations sous la forme 


a n 

« J 2 

... «ip 


«21 

«22 

• • • «2p 

y* 

«pi 

«p2 

... «pp 

■y? 

«p+/,i 

«p+/,2 

. . . «p-+-/,p 

y ? +/ 


Les premiers membres de ces relations sont les déterminants caracté- 
ristiques. Si les seconds membres du système (N) vérifient ces relations, 
le système se réduit à ses équations principales; sinon le système est 
impossible. 

Prenons le premier cas : dans les équations principales nous pouvons 
choisir arbitrairement les valeurs des inconnues x # p + 2 , . . • , \ le 

système des équations principales peut alors se résoudre par rapport 
aux inconnues principales par les formules de Cramer. Le problème est 
ici indéterminé, la solution dépend de n — p arbitraires . 

Outre le système considéré (N), nous allons être amenés à considérer 
le système homogène : 

I r «il X\ -4- «i 2 #2 -4- . . , -4- Xn — O, 

«î i X\ -h « 22 .-H «2 n x n = O, 

«nl#i-+- n nî XîH-. . .-+- ClnnXn = O, 
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et le système homogène transposé : 

d 11 Xi ■+■ <L\ 1 Xo-4- . . . -+* <x n 1 A n = O, 

6Ï12 X 1 -4— dUfc X 2 -H. . .-h <ï/iî A w = O, 

• • ' * * 5 

d\ n Xi -+- dm Xj -4- . . . 4- Clnn X/i = O. 

Ces trois systèmes ont les mêmes déterminants, extraits du tableau des 
coefficients (pour H', il suffit de permuter lignes et colonnes, ce qui ne 
change pas la valeur du déterminant). Donc (H') est de rang p; les con- 
ditions relatives aux déterminants caractéristiques sont satisfaites 
puisque tous les seconds membres sont nuis ; nous pouvons choisir arbi- 
trairement X p ^ , Ap +ii , . . . , X n , et résoudre les p premières équations par 
rapport à X*, X 2 , . . X p ; les n — p dernières équations sont vérifiées. 
Les solutions du système (H') dépendent donc de n — p constantes 
arbitraires X p+1 , . . ., X, t ; on peut introduire un système fondamental 
formé de n — p solutions indépendantes en donnant successivement à 
chacun de ces X la valeur 1 et aux autres la valeur o. 

De même les solutions du système (H) dépendent aussi de n — p 
constantes arbitraires; la solution générale du système (N) peut d’ail- 
leurs se mettre sous la forme de la somme d’une solution particulière et 
de la solution générale du système H. 

Finalement, nous arrivons à l’énoncé du théorème général de V alter- 
native : 

i° Ou bien le système (N) admet une solution quels que soient 
les yt [A 0], alors la solution est unique et les systèmes (H) et (H') 
n'admettent que zéro pour solution (ces trois affirmations sont équi- 
valentes ) ; 

2 0 Ou bien le système (H) et le système (H') ont des solutions diffé- 
rentes de zéro ; ils ont le même nombre de solutions linéairement indé- 
pendantes; soit r ce nombre [ A = o; rang p = n — r] ; le système (N) 
n'est résoluble que pour des seconds membres yt particuliers satis- 
faisant aux r relations qui existent alors entre les formes des pre- 
miers membres ; et s'il est résoluble , la solution dépend de r constantes 
arbitraires ( correspondant à la solution générale du système homo- 
gène). 

Dans cet énoncé on peut supprimer ce qui concerne les déterminants, 
et qui se trouve entre crochets. Ce théorème de V alternative peut 
être obtenu sans déterminants et peut se généraliser à des problèmes 
linéaires non algébriques. 
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4. Disons quelques mots sur la résolution d’un système linéaire de 
m équations à n inconnues : 

«n H- «12 x±-+-, . a in = 
an j?i-4-«*2 Où*-*-. . .-h «i« = 


«ml ■+* «/rtâ^â “+■•••■+* «m/i w 


En recherchant le nombre maximum de formes linéairement indé- 
pendantes, nous obtenons le rang du système 

pgm, 

P ^ n. 

Pour cette recherche, nous pourrons utiliser les déterminants : il y a 
un déterminant principal, des équations principales que nous écrirons 
les premières et des inconnues principales que nous affecterons aussi 
des plus petits indices. 

а. Si m <C n, distinguons deux cas : 

— m. — Nous choisirons arbitrairement les valeurs des inconnues 
30 m h î 30 m j.2, . . . , x n et résoudrons par rapport aux inconnues principales ; 
le système sera donc toujours possible et présentera une infinité de 
solutions dépendant de n — p constantes arbitraires. 

2 ° p < m. — Les formes ne sont plus indépendantes. Si les seconds 
membres annulent les déterminants caractéristiques, il y a une infinité 
de solutions dépendant de n — p constantes arbitraires. Sinon, le système 
est impossible. 

б. Si m^> n, alors p <n<C.tn. — Les formes ne sont pas indépen- 
dantes (*) et comme dans le dernier cas il faut former les caractéristiques. 

En résumé : 

Si le rang est égal au nombre des équations, le problème est toujours 
possible. 

S’il est de plus égal au nombre des variables, la solution est unique. 

Avant de reprendre directement ces questions en vue d’une générali- 
sation aux systèmes infinis, rappelons quelques notions relatives aux 
vecteurs pour simplifier notre exposé. 


(') En particulier n- 4 -i formes linéaires à n variables ne sont jamais indépendantes. 
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II. - NOTIONS ÉLÉMENTAIRES DE GÉOMÉTRIE LINÉAIRE HOMOGÈNE 
(GÉOMÉTRIE AFFINE). 

1. Définition par le calcul. — Un vecteur X de l’espace E n est un 
ensemble de n nombres complexes rangés dans un certain ordre : 

X = (X\, x 2, . . x n ). 

Ces nombres sont appelés les composantes du vecteur. 

Deux vecteurs sont égaux si leurs composantes sont égales : 

X = Y 

est équivalent à 

xi — yi pour i — i n. 

Nous allons définir sur ces vecteurs les opérations fondamentales : 

a. Produit d'un vecteur par un nombre. — Le vecteur aX a pour 
composantes aœ s , ax^ , . . ., ax n . 

b. Somme de deux vecteurs . — Le vecteur X 4- Y a pour compo- 
santes x K -\-y s , x 2 -\-y> 2 , . . ., x n -{~y n . 

De ces définitions il résulte immédiatement que la somme de plusieurs 
vecteurs est commutative, associative; qu’étant donné deux vecteurs X 
et Y, il en existe un troisième et un seulement qui ajouté au second 
donne le premier (différence); que le produit d’un vecteur par l’unité 
ne le modifie pas; le produit est distributif par rapport à l’addition des 
nombres et par rapport à l’addition des vecteurs; le produit est asso- 
ciatif par rapport aux nombres. 

Cette définition par le calcul introduit un système de vecteurs 
coordonnés qui sont privilégiés dans E n ; ce sont les vecteurs dont une 
composante est égale à l’unité, toutes les autres étant nulles. Nous allons 
donner une définition axiomatique de l’espace vectoriel à n dimensions 
qui ne fera plus intervenir de vecteurs coordonnés fondamentaux. 

2. Définition axiomatique. — Nous allons donner d’abord deux 
axiomes fondamentaux, qui vont nous définir des êtres X, Y, .... 

a . Addition . — A deux de ces êtres on peut en associer un troi- 
sième, qu’on appelle leur somme et qui jouit des propriétés suivantes : 

i° X + Y = Y+X (commutabilité), 

ü° (X + Y) + Z = X + (Y+Z) (associativité); 
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3° Si Ton se donne X et Y, il existe un être et un seul Z tel que 
X = Y -f- Z; on l'appelle différence de X et de Y et l'on écrit 

Z — X — Y. 

Comme conséquence il existe un être o qui est la différence X X 
et l'on a 

X+o = o + X = X, 

et à chaque X on peut faire correspondre un être oppose qui, ajouté au 
premier, donne zéro. 

b . Multiplication . — A un de ces êtres X et à un nombre a, on 
peut en associer un second, qu’on appelle produit de Y être par le 
nombre, qu'on désigne par la notation aX et qui jouit des propriétés 
suivantes : 

i° ixX = X, 

2° ( fi b ) X = et. X -+- b X 

(distributivité par rapport à l’addition des nombres), 

3° a(b\) = (ab)X 

(associativité relativement aux nombres), 

4° a(X + Y) = aX+<iY 

(distributivité par rapport à l’addition des êtres). 

Ces êtres s’appellent des vecteurs ; pour définir complètement 
l’espace vectoriel à n dimensions, il faut à ces deux axiomes en ajouter 
un troisième (axiome delà dimension); la géométrie homogène linéaire 
est basée sur l’ensemble de ces trois axiomes. 

Avant d'introduire le troisième axiome, tirons des conséquences des 
deux premiers. 

3. h vecteurs X<, X 2 , . . X* sont linéairement indépendants s'il 
est impossible d’avoir la relation 

Cl\ Xi -H CLi X 2 ... -h a h Xf t = O, 

à moins que tous les a ne soient nuis. 

Considérons h vecteurs X <? X a , . . ., X 4 , linéairement indépendants; 
et soit 

X = Ç 1 X 1 -+- Ç 2 X 2 - 4 -. . . 4 - Ç/ t .X^; 

l’ensemble des vecteurs X, pour toutes les valeurs possibles des £, forme, 
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par définition, une multiplicité linéaire Ea à h dimensions définie par 
les vecteurs X 4 , X 2 , . . . , Xa. On dit que ces vecteurs forment une base 
de la multiplicité et que , £2 , . . . , sont les composantes de X dans Ea 
relativement à cette base. Ces composantes sont uniques; supposons en 
effet que nous ayons 

X = ÇiXi + £2X2 -h. . . -4- 
X = Xi-h^ 2 X 2 -H. . Ç^X/i. 

Soustrayons membre à membre : 

( Çi ■ - Ü'i ) X , -f- ( U - r a ) X, -H . . . + ( \h - sA ) X/ t = O, 

et puisque les vecteurs X u X 2 , . . . , Xa sont linéairement indépendants, 
cette relation entraîne 

Ç/= Si pour i = 1, 2, h. 


Tout vecteur de Ea s’exprime donc, et d’une seule façon, comme 
combinaison linéaire des vecteurs de base. 

Montrons que h + 1 vecteurs de la multiplicité linéaire Ea ne 
peuvent être linéairement indépendants. Ces vecteurs sont définis 
par 

Çü Xi -h Ç/ 2 X S •+*. . .-t- Ç/ aXa pour / — 1 , 2 . . . . , h 1. 


Cherchons si nous pouvons avoir une relation : 


Soient 


Xi Yi -h Xj Y 2 -h ... -h Xa-4-I Ya-hI — o. 
A-h a 

J^X, = o, 

4=1 A= 1 

h A+ 1 

2 x* 2 çi*xi=°. 

k = 1 4=1 


Les Xa étant linéairement indépendants, cette relation exige 

/h- l 

2 )X/?<a=° pour k = i,2, ...,h 

4=1 


ou, sous la forme développée : 

£11 X| H- Çît X 2 -h . . . -+- Ç-A-H.l Xa+ 1 = O, 
£t2 Xi -f- £ 24 X 2 -h. . Ça-hI.î Xa H = o, 


ÇiaXiH- ^a'XoH- . . .-4- Ça-h,aXah-i = °j 
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système homogène de h équations à h -h i inconnues X 2 , . . . , ^a-m* 
Ce système est toujours possible (*) et présente des solutions non toutes 
milles; la proposition est donc établie. On peut d’ailleurs trouver effec- 
tivement dans Ea, h vecteurs linéairement indépendants : il suffit de 
prendre X,, X 2 , . . . , X*. Il en résulte que h est le nombre maximum 
de vecteurs linéairement indépendants dans Ea- 


4. Changement de base, 
de Ea, définis par 


Considérons h vecteurs Y f , Yj, . . ., Ya 


t = i 


et supposons que le déterminant | c//| ne soit pas nul. Si nous considé- 
rons ces relations comme des équations entre les lettres X et Y. ce sys- 
tème peut être résolu en X par des formules telles que 

h 

1=1 


Ce sont les expressions des vecteurs X en fonction des vecteurs Y; si 
nous les reportons dans le premier système, nous obtenons des identités. 
Soit un vecteur V de la multiplicité Ea : 

V =St X., -h Ç 2 -h Ç/jX/, =^jÇ/Xy. 

Nous avons donc 

h h h h 

v =2^2 ï//Y,= 2 Y '2 ï/if ^ 

j = i /-i t=i }— i 


soit 


V = TJi Yi -+* YJt Y 2 -4- . . . H- T f\h^h 


en posant 

ï i/ = 2?/ïy/- 
j = i 


Et, de même, toute combinaison linéaire des Y* est une combinaison 
linéaire des X*. Montrons que les vecteurs Y, sont linéairement indè- 


(>) Nous le savons ici par le paragraphe I relatif aux déterminants. Nous l’établirons 
au paragraphe III sans les déterminants. 
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pendants ; à cet effet, cherchons les X tels que 

2 X/Y ( = o, 

i 

soit 

« =2 x< 2 e< ' x,= 2 x '2 x<c "’ 

il ) i 

et puisque les X sont linéairement indépendants, 

h 

2^iC<y=o pour j =i, a, h. 

i=z i 

C’est un système homogène de h équations à h inconnues à déterminant 
non nul; il ne présente que la solution X t = o; les Y; sont linéairement 
indépendants. 

L’ensemble des vecteurs Y i peut donc être pris comme base de la 
multiplicité , au même titre que l’ensemble des vecteurs X;. 

Ces deux bases sont équivalentes. Le nombre des vecteurs d’une base 
quelconque de E4 est toujours h. Tout système de h vecteurs de E4 indé- 
pendants est une base. Deux bases distinctes se déduisent l’une de 
l’autre par une substitution linéaire à déterminant yé o. 


o. Axiome de la dimension. — L’espace E n lui-même possède n vec- 
teurs linéairement indépendants qui sont (espace vectoriel à n dimen- 
sions défini par le calcul) : 

e,(i, o, o, o), 
e,(o, i,o,.. , o), 


e n (o, o, o , 1), 

car on ne peut avoir ^ v 

Xl Ci -h Xo 6-2 -h ... H- X« e/i = o, 


à moins que les X ne soient tous nuis. Tout vecteur X de E ;| , ayant pour 
coordonnées #1 , # 2 , . . . , x n * peut se mettre sous la forme 

X = X\ e\ -h . .- 4 - x n e n . 


Les Xi sont les coordonnées absolues de X . 

Ainsi que nous l’avons déjà fait remarquer, la définition de E n par des 
coordonnées absolues introduit un système de vecteurs privilégiés, alors 
qu’un système quelconque de/i vecteurs linéairement indépendants peut 
très bien être pris comme système de coordonnées. 


JULIA 


3 
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Ceci ne se présentera plus au point de vue axiomatique. Les deux 
axiomes que nous avons énoncés dans le paragraphe 2 ne font pas inter- 
venir le nombre de dimensions de l’espace vectoriel dans lequel on se 
place; aussi leur adjoindrons-nous V axiome de la dimension suivant : 

Dans Vespace vectoriel à n dimensions E n il existe n vecteurs 
linéairement indépendants et n au plus . 

Nous allons voir qu’à partir de ces trois axiomes on peut bâtir la 
géométrie vectorielle affine, car on retrouve la définition analytique. 
Soient, en effet, e 2 , ..., e n , n vecteurs linéairement indépendants 
dans E n et X un vecteur quelconque de E n ; ces n- f- i vecteurs ne 
peuvent être linéairement indépendants. Nous avons donc : 

«X -4- €\ -4- £2 -h . . . -h %n€n = U 

avec a, Ç,, Ç 2 , . . . , Ç*, non tous nuis. Puisque les e 1f e 2 , . . . , e n sont 
linéairement indépendants, a n’est pas nul; nous pouvons donc résoudre 
en X la relation précédente : 

X = x v et -+- x 2 e 2 -f- . . . x n e n . 

C’est la définition analytique deE n ; mais, par le procédé axiomatique, 
tous les systèmes de coordonnées sont a priori équivalents. L’application 
des axiomes a et b donne ensuite les règles de calcul prises comme défi- 
nition au n° 1 qui précède. 

6. Nous pouvons définir (par voie axiomatique toujours) une multi- 
plicité linéaire par un système de vecteurs X,, X 2 , . . . , X*, .... Les 
vecteurs 

X = dXi -+- c 2 X 2 -+- . . . -h* C/X/ 

( a nombres complexes arbitraires), combinaisons linéaires d’un nombre 
fini (quelconque) des vecteurs Xa constituent la multiplicité linéaire défi- 
nie par les vecteurs donnés, qui peuvent être en nombre fini ou infini . 
Les vecteurs donnés sont dans un espace à n dimensions; le nombre 
maximum d’entre eux, qui sont linéairement indépendants, est donc h<n; 
soient X,, X 2 , . . . , X* de tels vecteurs et soit X un vecteur quelconque 
de la multiplicité. Ces h -f - 1 vecteurs ne peuvent être linéairement 
indépendants ; nous avons donc 

U X -4- £, Xi -4- £ 2 X 2 -4- . . . -4- ^ Xa = o 

avec « » » & » • • • i & non tous nuis ; a n’est pas nul puique les X* , X 2 , . . . , X a 
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sont linéairement indépendants. Nous pouvons donc résoudre en X la 
relation précédente 

X = ÇtXi -4- $ 2 X 2 - 4 -. . . -h if/jX*. 

Nous retrouvons la définition d’une multiplicité linéaire à h dimensions 
ayant pour vecteurs de base X iy X 2 , . . . , X/,. 

7. Décomposition d’un espace à n dimensions. — Soient deux espaces 
partiels (ou multiplicités linéaires) E' à n' dimensions et E" à n " dimen- 
sions, tels que tout vecteur de E puisse d'une manière et d'une seule , 
se décomposer en la somme de deux vecteurs , l'un appartenant à E', 
Vautre à E". Dans ces conditions nous dirons avoir décomposé l'espace E 
en deux sous-espaces E' et E", et nous écrirons 

E = E'-h E", 

E' et E" sont dits complémentaires. 

Les deux sous-espaces ne peuvent avoir en commun que o, car si le 
vecteur X ^ 0 leur appartenait à tous deux, le vecteur X de E pourrait 
se décomposer de deux manières, à savoir : X (de E') -f- o (de E"), ou 
bien : o (de E')-}-X (de E ,r ). Dans le sous-espace E' à n' dimensions, 
choisissons n' vecteurs linéairement indépendants formant un système de 
base : X', , X 2 , X' /l0 et faisons de même dans E" : X", X", ... X"„. 

D’apr ès la définition même de la décomposition, X étant un vecteur 
quelconque de E, nous avons 

X = X'H-X ff , • 

X' appartenant à E' et X" à E"; soit 

X = e; Xi -h 5i X' a + . . . i^x' /t , + Ç'J x; + s; x; + . . . + «A. 

Les vecteurs X'- et XJ sont linéairement indépendants, car si l’on avait 

a\ Xi + a' 2 X ' 2 + ... + a^, X' /t , -+- a'J X'J -4- oej X J . -h a"„ X",„ = o, 

l’ensemble des n f premiers termes constituant un vecteur de E' et 
l’ensemble des n " derniers un vecteur de E", chacun de ces ensembles 
serait nul, E’ et E" n’ayant que 0 en commun. Les X' étant indépendants, 
ainsi que les X", il s’ensuit la nullité de tous les a. 

L’ensemble des vecteurs X'- et XJ constitue donc un système de 
base pour E qui a par conséquent n^n’+n!’ dimensions. Donc la 
réunion d’un système de coordonnées de E' et d’un système de coordon- 
nées de E", forme un système de coordonnées de E que nous dirons être 
adapté à la décomposition E=E'-j-E". 
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Nous pouvons dire encore que, si Ton se donne dans E„ deux sous- 
espaces n’ajant en commun que zéro, E' à n ' dimensions etE" à n dimen- 
sions, tels que n = l'espace E est décomposé en les deux 

sous-espaces E' et E". C'est immédiat : choisissons dans E', n ! vecteurs 
de base X, , X. 2 , . . . , X rt /, et dans E" n" vecteurs de base X n ^, , X n r+ 2 , . . . , X n . 
Par une démonstration identique à la précédente, nous montrerions 
que ces /z = n-' -f- zz" vecteurs de E sont linéairement indépendants; ils 
forment donc une base de E. Un vecteur de E peut, d’une manière et 
d’une seule, se mettre sous la forme 

X = (£1X1 -f* £2X2 -4-. . . -h -h ( $//'+ ! -f- X„ ), 

X = X'H-X ff . 

Deux espaces complémentaires dans E n sont donc caractérisés par 
deux propriétés : ils n’ont en commun que zéro et la somme de leurs 
nombres de dimensions est n . 


8. Projection. — Soit dans l’espace E à n dimensions un sous- 
espace E' à n r <C n dimensions. Deux vecteurs X et Y dont la différence 
appartient à E' sont dits congrus relativement à E'; nous noterons cette 
relation : 

X ~ Y ( mod E'). 

Nous avons évidemment 

X s X (mod E') 


et, d’autre part, les deux relations 


entraînent 


X = Y (mod E'), 

Xh=Z (mod E') 

X ™ Z (mod E' ). 


Nous allons maintenant faire une abstraction et dire que tous les 
vecteurs congrus suivant E' définissent un seul vecteur 3Ù d’un espace 
vectoriel & à n — n f dimensions, appelé espace projection de E parallè- 
lement à E'. D’une façon concrète nous pouvons associer à E' son sous- 
espace complémentaire E", tel que 

E = E'-hE". 


Nous savons que dans ces conditions un vecteur quelconque X de E 
peut se décomposer en un vecteur de E' et un vecteur de E", et cela 
d'une seule manière : 

X = X'-+-X\ 
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Si X == Y (mod E'), puisque X — Y = X'— Y'-f- X'- Y", X'- Y' 
ôtant un vecteur de E', X" — Y" étant un vecteur de E v , on aura nécessai- 
rement X" = Y". Si deux vecteurs X sont congrus suivant E', ils ont le 
même X". Nous pouvons donc dire queX" est une image de SÙ et qucE" 
est une image de 3. 

Revenons sur notre définition de 3 et prouvons que l’ensemble des SÙ 
forme effectivement un espace vectoriel. En effet, la relation 


entraîne 


Xt==X 2 (mod E') 
aX 1 = <*X 2 (mod E'); 


autrement dit, si âC appartient à 3, il en est de même de aSC. D’autre 
part,, les relations 

X, «s X 2 (mod E') 


et 

entraînent 


Y,==Y 2 (mod ¥,’ ) 

Xt -4- Y | ~ X.) Y 2 (mod ) 5 


autrement dit, si SÙ et ^ appartiennent à 3, il en est de même de leur 
somme Sù - h ^)- 

Les opérations d’addition et de multiplication par un nombre s’appli- 
quent aux vecteurs fSl de 3. Au vecteur âC = o de 3. correspond un 
vecteur quelconque de E'. 

Cherchons le nombre de vecteurs linéairement indépendants de 3 , 
c’est-à-dire le nombre maximum h de vecteurs 3Ü 2 , . . ., $£/,, non 
nuis, qu’il soit possible de trouver dans 3 , tels que 

( 1 1 vCj + a 2 ■+■ . . . -+- et k h — o 


entraîne la nullité de tous les a . Gela revient à chercher le nombre 
maximum h de vecteurs X 4 , X 2 , . . X^, n’appartenant pas à E', qu’il 
soit possible de trouver dans E, tels que la relation 

a.\ X 4 h- ctiXo ci/i X/# = X^ 

X' étant un vecteur quelconque de E', entraîne la nullité de tous les a . 
-Or si à E' nous adjoignons E", son sous-espace complémentaire dans E, 
tel que 

E = E'-+- E", 

tout vecteur X* de E se décompose d’une façon unique en la somme de 
deux vecteurs appartenant à chacun des deux sous-espaces : 

x,=x;-4-xï 
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(l\ X*j -+- #2X3 * 4 - . . . dfoXfr = O, 

Il en résulte que h est le nombre maximum de vecteurs linéairement 
indépendants de E" ; donc h = n ff = n — n f . 

Si E' a une dimension, E" a n — i dimensions et constitue la projec- 
tion ordinaire de E parallèlement à la direction de E'. 

Nous dirons que, quel que soit a, l’ensemble des vecteurs aX constitue 
un même rayon qui sera défini parles rapports mutuels des#,, x 2 , x n 
supposés non tous nuis. 

9. Changement du système de coordonnées. — Soient <?*, ..., e n • 
n vecteurs linéairement indépendants formant une base de E. Un 
vecteur X quelconque de E peut se mettre sous la forme 

(O 

i 

Les nombres x x sont des coordonnées relativement à ce système de base. 
Considérons maintenant n vecteurs e\ , e' 3 , . . . , ë n , de l’espace E, définis 
par 

n 

t=i 

Nous avons déjà vu que la condition nécessaire et suffisante pour qu’ils 
soient linéairement indépendants est que le déterminant | a,/; | ne soit pas 
nul; ils forment alors un système de base, et l’on îf 

(2) x 

k 

Les oc k sont les coordonnées du vecteur X par rapport au nouveau sys- 
tème de base, et nous avons 

X = 2^*2 aike i" = ^ d € l y ^a l kx , k , 
k i i k 

soit, en identifiant avec la relation (i), 

n 

Ce sont les formules de changement de coordonnées. Elles sont les 
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mêmes pour tous les vecteurs de l’espace E, dont les composantes se 
transforment d’une manière bien déterminée quand on fait le change- 
ment de base indiqué. 

Toutes grandeurs dont la définition dépend du choix des axes de 
coordonnées, qui admettent des composantes et qui sont telles que ces 
composantes se transforment, dans le changement de base, à l’aide des 
formules ci-dessus, sont dites covariantes entre elles. Tous les vecteurs 
■de E n sont donc covariants. 

10. Nous allons définir, en géométrie homogène linéaire, le produit 
intérieur de deux vecteurs X et Y j^nous ne considérons pas cette expres- 
sion comme synonyme de produit scalaire ; nous réservons cette dernière 
expression pour une autre quantité introduite en géométrie métrique, à 
savoir 2#,/; j . Si X a pour coordonnées 

x±, ..., Xn et Y : y\ , y,, ...,y n , 
le produit intérieur est, par définition, 

.-h x n y n . 

Nous avons les propriétés suivantes qui sont évidentes : 

XY = YX ; 

Xi=Xe h 

eiôk = %ik (c’est-à-dire o si i ÿé k, i s» i = k) t 

a(XY) == (ocX)Y — X(a Y) (si a désigne un nombre), 

X( Y -h Z) = XY 4- XZ, 

et, plus généralement, 

x ( 2 y < )= 2 xy '- 

Considérons alors une forme linéaire : 

/ = «i x ± -4- a 2 x t . . .-f -a n x n ; 

elle peut être considérée comme le produit intérieur de deux vecteurs : 

A de composantes a K , . . . , a n ; 

X de composantes X \ , # 2 , . . . , x n , 


et s’écrire 


/(X) = AX. 
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Si Ton a 

X = Çi X, ■+* ^->X.2 5/iX/ t , 

il s’ensuit que 

/(X) = YX = A ^ =2 Î,(AX,) =2?'/ (X,) - 

Si donc /(X) est une forme linéaire, nous avons en particulier les 
deux propriétés : 

f(aX) = af(X), 

/(X + Y)=/(X)+/(Y). 

Je dis que ces propriétés caractérisent les formes linéaires, c’est-à-dire 
que si à chaque vecteur X j’associe un nombre L(X) tel que 

( L(oX) = aL( Y), 

( L(X + Y) = L(X) + L(Y), 

L(X) est une forme linéaire. 

En effet, 

X = Xy €i H- OC -y €*> -h ... -h X n e H 

étant un vecteur quelconque, en appliquant successivement la seconde, 
puis la première propriété, il vient 

L(X) = L(ei) -h x i L{e. î ) -h . . . -+- x n L(e n \ 

où L(<?,),L(e 2 ), . . L(e n ) ne dépendent pas du vecteur X; la propriété 
est bien établie. En résumé, une forme linéaire est une fonction linéaire 
d’un vecteur ou bien encore un nombre attaché à un vecteur et satis- 
faisant aux relations fonctionnelles (L). 


III. — RÉSOLUTION ET DISCUSSION 
D’UN SYSTÈME D’ÉQUATIONS LINÉAIRES SANS DÉTERMINANTS (*). 

1. Les éléments précédents de la théorie des vecteurs vont nous 
servir à exposer la méthode de Tœplitz pour résoudre et discuter un 
système linéaire de m équations à n inconnues. 


( >) Voir Schmidt, Rendiconti del Circolo Matematico di Palermo, 1908; Tœplitz, 
Ibid,, 1909; Hassr, Hôhere Algebra (Gôschen, 1926). 
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Soit le système : 

# 1 1 x i -f- ci 1 2 X'i H- ... - 4 - a, | n X/i — ci 
#21 #1 *+• #22 X t -+“•••-+- #2/i Xn — «2, 

* J 

\ Gm \ X \ Cl m 2 X-i -f* . . . -+- Cl/nn Xn — Cl /n . 

Nous désignerons aussi le premier membre de la * ième équation par //(X) 
ou A;X. 

Nous allons procéder à une première opération qui va « nettoyer » 
le système ou, d’une façon plus précise, le débarrasser des équations 
qui sont des combinaisons linéaires d’autres équations du système. 
A cet effet, nous cherchons le nombre maximum de formes 
linéairement indépendantes que l’on peut choisir parmi les 
m formes données aux premiers membres; soit r ce nombre, rang du sys- 
tème N(i) (certainement r<n, r<J m); nous désignerons les formes corres- 
pondantes par/*,/ 2 , . . . . En employant un langage vectoriel, nous 
pouvons dire que nous cherchons le nombre maximum de vecteurs A 
linéairement indépendants et que nous désignons par A n A 2 , . . . , A r 
ceux d’entre eux qui peuvent être pris pour base. Un vecteur A autre 
que ceux-ci [ou une forme f autre que /,, / 2 , . . est une combi- 
naison linéaire des r premiers ( voir § II, 6); on peut donc trouver des 
nombres tels que 

fr + 1 === ^ll f\ - 4 “... -h A \ r fn 

> 

f m = -r.if i “H U/i—r, rf r > 

Si nous remplaçons x par une solution du système N(i), nous 
avons /;= ai et par conséquent : 

I #/•-)- 1 = } mi#i *+• X , r a n 

dm — #1 ■+*••■ H“ /•,/•#/•* 

Ce sont donc là des conditions nécessaires imposées aux seconds membres 
pour que le système N(i) présente des solutions; les solutions du sys- 
tème N(i), si elles existent, vérifient 

l = 

N(a) , 

f f r -O r . 

Montrons que, réciproquement , si les conditions G sont remplies, 
toute solution de N( 2 ) est solution de N(i). Ceci est immédiat : si X 
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est solution de N(a), les r premières équations de N(i) sont satisfaites; 
d’autre part, considérons par exemple la (r 4- i) Ièrae forme : 

fr-bl s l “H. . . X] rfr î 

quand on y remplace x par une solution de N( 2 ), elle prend la valeur 

X , î i —4— . . Xj r&r) 


qui est égale, d’après (G), à donc les n — r dernières équations 

de (N,) sont aussi satisfaites. Nous avons ramené notre système à 
ce qu’on appelle, dans la théorie avec déterminants, ses équations 
principales : 

/r = dr\3C\ -h d r n^n U r . 


2. Nous allons maintenant franchir une nouvelle étape. Définissons 
d’abord ce, qu’avec Tœplitz, nous entendons par longueur d’une 
forme linéaire à n variables; en supposant les n variables affectées des 
indices î, 2 , . .., n, nous désignerons par longueur d’une forme, la 
valeur de l’indice le moins élevé tel que toutes les variables affectées 
d’indices supérieurs aient dans la forme considérée un coefficient nul. La 
longueur suppose donc un ordre de numérotage imposé pour les variables. 
Une forme ne contenant que l’inconnue x p+i est plus longue qu’une 
forme qui contiendrait effectivement x K , x > 2 , . .., x /n mais aucune 
autre variable. 

Ceci étant posé, formons toutes les combinaisons possibles des r 
formes/,, / a , . . . , f r . Aucune n’est identiquement nulle puisque ces 
formes .sont supposées linéairement indépendantes; leurs longueurs sont 
donc toutes comprises entre î et n ; soit k { (î ^ /r, <n) la longueur 
minima obtenue par (au moins) la forme 

Yt = ïll/i ■+*... .-«-Tl rfr- puO?i-+-. ..-h pijfcjÆ?*,, 

avec (3,*, t^o (sinon la forme serait de longueur moindre). Nous pou- 
vons la normer en la multipliant par un facteur convenable, de façon à 
rendre le coefficient de x kx égal à l’unité : 

S t — Ci | f\ -h . . . -h C\ r f r — biiXi-tr bi t X t -h ... -h b\ t k x — 1 Xk x — \ H- Xk v 

Il est évident qu 9 il n’y a qu’une combinaison normale de lon- 
gueur ki) car s’il y en avait deux, en les soustrayant on obtiendrait 
une combinaison linéaire de longueur moindre; ce qui est impossible 
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(puisque ki est la longueur minima), à moins d’obtenir un résultat 
identiquement nul, auquel cas la seconde combinaison serait identique 
à la première. Parmi les coefficients c H » c i2y . .., c lr , il y en a un 
au moins qui n’est pas nul; nous pouvons toujours supposer que c’est c 4r 
en interchangeant au besoin les indices des formes / 4 ,/ 2 , . . .,/ r « 

Nous allons maintenant recommencer les mêmes opérations sur les 
formes /1, / 2 , . . . , 1 . Formons toutes leurs combinaisons linéaires; 

elles ont des longueurs comprises entre 1 et n dont le minimum est k 2 \ 
celte longueur correspond à une combinaison 

Ï 2 = T*l/l -+- ï* 2 /*-*-• • •■+■ 
que nous normons : 

gl = Cî\ f\ •+- ^22/2“+-. . . H- C 2 ,/ — \fr— 1 — b iX x \ *+" ^22 bî f k t -i X k x — 1 ■+■ 

Cette combinaison des / 2 . fait partie des combinaisons 

des /0/25 • • •?// • P* 11, conséquent 

4 *^ 4 ,. 

L’égalité est impossible, car il n’y a qu’une forme de longueur k { et 
les formes g x et g 2 ne peuvent être identiques en raison de la non- 
nullité de c Xr et de l’indépendance des formes / 4 ,/ 2 , ; les formes 

gu et g 2 sont linéairement indépendantes : la dernière contient effecti- 
vement des variables que la première ne contient pas. 

Et nous recommençons : parmi les coefficients c 24 , . . . , un 

au moins n’est pas nul, soit c 2)/ _ 4 . Nous écartons la forme / r _ 4 et nous 
formons les combinaisons linéaires de , / 2 , . . . , / r _ 2 , ce qui nous con- 
duit à un nombre 4 r 3 > /r 2 , longueur d’une forme g * , et ainsi de suite 
jusqu’à la r ièm6 opération qui nous donne 

£> = W,. 

Parallèlement, formons les combinaisons des seconds membres 

b \ — c t 1 a x . .-f- C\ r a ri 
b-i = Ci||«i H-. . C 2 ,r— \Ctr— l, 



b j' — Cf ' | CL X . 

Les solutions de N (2) satisfont évidemment au système récurrent 

( £-iS= bi y k l -\ x k t -v-k- Xk x —bu 

N( 3 ) \ gt^b'i\x x -\- -+- bifr- i x k t — 1 -+* x k t ^ b if 


g r ~ b r \ x \ -f* 


-h = bi 
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i ^ Xri <C ki A>g n. 

Montrons que ce système N (3) est équivalent au système N ( 2 ), c’est- 
à-dire que toute solution de N(3) est aussi solution de N( 2 ). En effet le 
système N(3) peut s’écrire 

g\ s c i\f\ ■+■ c lifi •+■•••■+■ c \r fr — C t | «| -4- C { -> a* -h . . . 4- C u * a n 
Ci,/, H- £ l ifî H- y* r _| = 0 21 ai H- C it Clt -h . . . -h C- 2i t WJ 


gr~ Cri — c rl ^1 

• Puisque c ;1 ^o, la dernière relation donne /< :-a, [première équation 
de N(a)]; c r _, î2 n’étant pas nul, la précédente donne / 2 = a 2 [seconde 
équation de N( 2 )], et ainsi de suite jusqu’à la première qui donne 
f r == a r [dernière équation de N( 2 )]. 

Pratiquement , pour obtenir le système N(3) de Tœplitz à partir du 
système N( 2 ), nous procéderons de la façon suivante : 

Cherchons la variable d’indice le plus élevé, qui n’est pas multipliée 
par un coefficient nul clans toutes les équations de N( 2 ); ce sera x kr 
affectée d’un coefficient non nul dans une équation au moins; multiplions 
cette équation par un facteur convenable de façon à rendre égalé l’unité 
ce coefficient; nous obtiendrons 

gr= b r . 

De cette équation tirons x kr en fonction des variables d’indice moindre 
et reportons dans les r — 1 autres équations; recommençons sur 
celles-ci les mêmes opérations jusqu’à obtenir une seule équation 

g\ - b\. 

Remarquons que de la relation 

nous déduisons l’égalité n’étant possible que si les k sont formés 

de la suite des n premiers nombres entiers. 

3. Nous sommes maintenant en mesure de discuter le système linéaire 
proposé N(i). 

Si les conditions (C) ne sont pas remplies, nous avons déjà vu 
que N(i) est impossible; nous allons montrer que dans le cas contraire 
N(i) présente des solutions. En effet, alors, N(i) est équivalent à N(3) 
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et sur ce système la chose est évidente : choisissons arbitrairement 
. .., Xk t -\ , la première équation nous détermine x ki ; choisissons 
encore arbitrairement l ft deuxième équation 

nous détermine x ki et ainsi de suite. Nous avons ainsi obtenu une solu- 
tion particulière du système proposé et nous savons que la solution 
générale est la somme de cette solution particulière et de la solution 
générale du système homogène (H*) 

I flf i X\-\-d\% X%-h . . .-H Cl\n Xn — Oj 
d-> i X\-\~Cl-)'i Xi -4~ (l->n X n — O , 

; 

a ml X I -h Cl mi X-i ct mn X n— O . 

La méthode de Toeplitz nous permet de démontrer que dans l'espace 
E m à m dimensions, il ne peut y avoir n > rn vecteurs linéairement 
indépendants; car sinon, il y aurait m équations homogènes à/i>m 
inconnues qui ne devraient présenter que la solution o ; or, d’après la 
forme de Tœplitz, il y a dans la résolution du système n — r inconnues 
arbitraires avec n — r >> o, car /•< m est inférieur à n. 

Un système infini de vecteurs de E n présente certainement une base, 
car le nombre de ses vecteurs linéairement indépendants est limité. 
Une infinité d’équations à n inconnues peut donc être ramenée à ses 
équations principales. 

Les solutions du système (H,) forment un système de vecteurs; 
parmi eux on peut en choisir au plus s^n linéairement indépendants, 
soient X,, X 2 , ...,Xj. Et une combinaison linéaire arbitraire X de 
ces s vecteurs estime solution du système homogène ( 1 ). L’ensemble 
des solutions du système homogène forme une multiplicité linéaire de 
base X| , X 2 , . . . , Xj. 

Nous allons montrer que s=zn — r, n représentant le nombre de 
variables et r le rang du système. En effet, nous pouvons remplacer (H,) 
par le système'récurrent équivalent 



gr— O . 


Si nous choisissons arbitrairement =£i, = £2* • • • ? x ki _ t 

la première équation détermine x ki \ choisissons encore arbitrairement 

( l ) On dit que X,,X a , X, forment un système fondamental de solutions de ( H, ) 
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Vk t +< = ko ^ t +2 = lk t + 1 » * • • ? Xk % -\ = £*,-2, la deuxième équation déter- 
mine a?* t , etc. Par conséquent, on peut choisir arbitrairement toutes les 
variables autres que x ki , x (tt , . . . , x kr . Désignons ces autres variables 
par Xkr+s æ *r +% ? •••> î la solution générale du système H 2 peut s’écrire 

&k x — «il H“ «iaÇî-4-. • ••+■ «i,n— r£n— r> 

Xk t — «2i£l-4“ «22 Çî-H. . .-4- «2,n— r£/i— r> 


= «rl £l -+- «r2^2 H- ... -h « r t n—r%n—r, 

&k r+i = Çl, 

= — r> 

les £ étant des coefficients arbitraires. Nous avons donc n — r solutions 
fondamentales : 


an 

«1* 

«ljtt — r 

«2 1 

«22 

«2 r 

a r! 

a r a 

a r,n—r 

I 

0 

O 

0 

1 

0 

0 

0 

, 


qui sont linéairement indépendantes, comme on le vérifie immédiatement 
par identification des n — r dernières variables. Nous avons donc 
bien s = n — r. 

Considérons le système homogène transposé (H', ) : 

| «lt X, -4- «2| ^'2 "4“ • • • "+“ «ml — O, 

«12 ^1 -+- «22 ^2 4 - . . . -f- «ma ^m = °> 

. 

«in^l *+- «2«^2 *4- ... 4- Ct m n ^ m — O. 

Soit s' = m — r' le nombre de ses solutions linéairement indépendantes 
(r' étant le rang de H' ); nous allons montrer que 

s' = m — r , 

c’est-à-dire que le nombre de lignes linéairement indépendantes dans 
le tableau {ou matrice) des coefficients de est égal au nombre 
maximum de colonnes linéairement indépendantes , ou encore 
que (H*) et (H, ) ont même rang : 

r = m — s', r' — n — s avec r = r . 
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Désignons par r le nombre maximum des lignes linéairement indé- 
pendantes (rang de H<) et affectons-les des premiers indices ( voir au 


n° 1 de ce paragraphe) 

Ai(au, am, . . . 

? Uin ), 



A*(a2i, #*2» ■ • • 

- s Utn )> 


On a vu que 

A r (a r i, a r i f . . 

•j U r n)> 


Alt Ai -+- . 

. .-f- X !r A r , 

Af-4-i ( Æ/m-1 ,1 > •• 

• j ), 


î f 

A/u = X m _, *,1 Aj -h . . . -f- A r , A m ( #m,n, • • • j &m,n )• 


Le système homogène transposé (H,) présente donc les solutions sui- 
vantes : 


}<. ni —r t î 

^ m—r,r 

O 

O 


dernières composantes); le nombre m — r' de solutions linéairement 
indépendantes du système (H'*) est donc supérieur ou égal km — r, 
soit 

m — r'2 m — /*, 

ou bien 

/•' < r. 



X 4 ,i 

^1,2 

^3,2 

>-.,r 

X* ,/• 

I 

o 

0 

— i 

0 

O 

nt indépendantes (toui< 


Mais en renversant les rôles du système homogène et du système 
homogène transposé, nous démontrerions de même que 


Donc 


4. Nous pouvons donner aux conditions (C) (n° 1) une forme 
moins particulière; elles expriment que si X' est une des solutions 
fondamentales du système transposé, on doit avoir 

X'A = o, 
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où A est le vecteur a, , . . . , a m dont les composantes sont les deuxièmes 
membres de N(i). 

Vu la linéarité de cette condition, il est équivalent de dire que A doit 
être orthogonal aux solutions fondamentales du système transposé 
ou bien que A doit être orthogonal à toutes les solutions du système 
transposé. Nous pouvons exprimer encore autrement cette dernière 
condition : pour que le système N(i) présente des solutions, il faut et il 
suffit que toute relation existant entre les premiers membres existe aussi 
entre les seconds membres. 

Dans le cas particulier où m = toute celte étude nous conduit 
encore au théorème de V alternative : 

Si r = tt, le système homogène n’a que zéro pour solution. Le système 
non homogène a toujours une solution et une seule. 

Nous dirons, dans ce cas, que le tableau (ou la matrice) des coeffi- 
cients est régulier. 

Si r < n. le système homogène a des solutions non milles, ainsi que 
le système homogène transposé. Le système non homogène n’est pas 
toujours possible; pour qu’il le soit, il faut et il suffit que les seconds 
membres forment un vecteur orthogonal à toutes les solutions du système 
transposé (ou, ce qui revient au même, aux solutions fondamentales de 
ce système); et si le système non homogène est possible, sa solution 
générale n’est pas unique puisqu’elle s’obtient en ajoutant à une solution 
particulière la solution generale de l’équation homogène. Nous disons 
ici que le tableau (ou matrice) du système est irrégulier , ou singulier , 
ou dégénéré. 
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I. — DÉVELOPPEMENTS DE GÉOMÉTRIE AFFINE. 

CALCUL DES MATRICES. 

Nofis avons vu dans le chapitre précédent l’effet du changement 
de base sur les coordonnées d’un vecteur de l’espace E„. Soit 
e 2 , . .., e n l’ancienne base et soit s 2 , . s n la nouvelle définie 
par 

e* = «iKi -h «2/tes-h. . .H- a n tfn pour /*•== i, .... />. 

Si nous désignons par # 2 , x n les anciennes coordonnées et 

par Ei, 1**2 5 . . . , \ n les nouvelles, nous avons la relation 

X = x-ie» +...+ a , /l r„^ Çiê, -+- *-> -t- s„e w , 

ou, d’une façon plus abrégée, 

/ k 

En remplaçant s* par son expression en fonction des e , il vient 

^ X i e i =2 5*2 aikei = '£ i ^'2 ^ 

r k i i k 

et puisque les £,• sont des vecteurs linéairement indépendants, celle 
égalité vectorielle est équivalente à 

#i“=2 «ot S/-» 

k 

X-l =2 
* 


X n ankÇ*. 

i 


JULIA 


4 
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Les composantes x se déduisent donc des composantes £ par une subs- 
titution linéaire A caractérisée par le tableau des coefficients ou matrice 


«Il 

ai2 

. . «j n 

an 

«22 

• • «2/1 

«/il 

v. . 

Uni 

• • «/i/i 


et nous écrirons plus brièvement 

A = \\a t k\\. 

Le déterminant | au | s’appelle le déterminant de A. 

Remarquons que le déterminant | au | de celte matrice A n’est pas nul 
puisque les vecteurs £; sont linéairement indépendants ; une telle matrice 
est dite régulière . 

Remarquons encore que les termes de la Æ lèrae colonne de la matrice 
sont les composantes du vecteur e* (/r iè,nc vecteur coordonné nouveau) 
dans l’ancien système de coordonnées; cette interprétation d’une 
colonne de la matrice nous sera par la suite d’une grande utilité. 

2. On peut donner à la matrice un autre sens plus général, puisqu’il 
permet d’envisager des matrices irrégulières ; on considère les £, 
comme étant les composantes d’un vecteur S et les x comme étant les 
composantes d’un vecteur X par rapport à un même système de coor- 
données ; nous désignerons par A l’opération permettant de passer de 
à X et nous écrirons 

X = AS. 

A s’appelle un opérateur linéaire (') et définit une opération ou 
transformation linéaire pouvant s’appliquer à un vecteur quelconque 
de E„; on s’assure immédiatement sur les formules développées données 
plus haut que cette transformation est bien linéaire, c’est-à-dire qu’au 
vecteur 


elle fait correspondre le vecteur 

X = X t -+- x„ 


(*) Nous emploierons en général indistinctement le mot opérateur ou matrice, bien 
qu’à vrai dire on doive distinguer entre l’opérateur géométrique et la matrice algébrique 
par laquelle s’exprime l’opérateur dans un certain système de coordonnées. Si le système 
de coordonnées change, l’opérateur géométrique restant invariant, la matrice change 
{voir § II). 
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X< étant le transformé de £* et X a celui de ; et qu’au vecteur 

aS 

elle fait correspondre le vecteur 

aX, 

a désignant un nombre. 

Un système de n 2 nombres <Hk définit un opérateur linéaire, régulier 
si le déterminant A n’est pas nul, irrégulier ou singulier ou dégénéré 
si le déterminant est nul. Les colonnes de la matrice ont encore 
une interprétation très simple : ce sont les composantes des vecteurs 
transformés de e s , e 2 , . . e n ; par exemple le transformé e* de e* a 
pour coordonnées 

M\ky Mi k) •••) Mftk» 

Il en résulte que, pour définir, analytiquement ou géométriquement, 
un opérateur A, il faut donner les n vecteurs e* transformés des 
vecteurs coordonnés par A(e* = Ae*). 

Les deux interprétations précédentes d’une matrice peuvent être 
reliées Vune à Vautre de la manière suivante : 

Soient £ t les composantes de H par rapport aux nous avons la rela- 
tion 



i 


Appliquons la transformation linéaire A au vecteur a; il vient 
X = AH = SÇ,A«, = 

Par conséquënt X a pour composantes £* par rapport anx s*; en 
résumé, si Von opère sur les vecteurs de VespaceTL tl et sur les vecteurs 
coordonnés la même transformation A, les coordonnées relatives des 
vecteurs ne sont pas changées par celte transformation . 

Dans la suite, il nous arrivera de combiner les deux points de vue : 
pour étudier un opérateur linéaire nous choisirons les vecteurs coor- 
données les plus favorables, de façon que la matrice représentant 
l’opérateur soit la plus simple possible (représentations canoniques ). 

3. Égalité des matrices (ou opérateur). — Nous dirons que deux 
matrices (ou opérateurs) A et B sont égales lorsque, appliquées à un 
même vecteur quelconque , elles donnent le même résultat 

AX = BX, 

quel que soit X. 
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Les coordonnées correspondantes de ces deux vecteurs sont donc 
égales, soit 

^ atkXk bjkXk pour / = 1,2, 
k k 

Ces relations, devant être vérifiées quelles que soient les valeurs attribuées 
aux x, entraînent 

a ik = bik, 

quels que soient i et k. 

La condition nécessaire et suffisante pour que deux matrices soient 
égales est que les éléments correspondants soient égaux. 

Somme de deux matrices {ou opérateurs), — Nous dirons qu’une 
matrice S est la somme de deux matrices A et B (et nous écrirons 
S = A + B), si à un vecteur quelconque X elle fait correspondre la 
somme des vecteurs transformés de X par A et par B 


Soit 


ce qui entraine 


SX = AX 4- BX. 

^ SjkXk — a ik^k “H 2 bik# h 

k k k 

Sik— O ik bik. 


Par conséquent, pour faire la somme de deux matrices, on ajoute les 
éléments correspondants. La généralisation à la somme de plusieurs 
matrices est immédiate; cette opération est associative et commutative 
(ces deux propriétés étant vérifiées par la somme des éléments corres- 
pondants). 

On définit immédiatement la différence de deux matrices A et B : 
c’est une matrice C qui ajoutée à B donne la matrice A, 


soit 

d’où 


A = B -h G, 

<Uk= bik 4 - Ça, 
Cik= a it t— b^. 


Par conséquent la soustraction de deux matrices est toujours possible et 
d’une seule manière; ses termes s’obtiennent en retranchant les termes 
correspondants des deux matrices données. 

Nous dirons qu’une matrice est nulle si elle transforme un vecteur 
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2 atkXk — o, 
k 

et puisque les x sont arbitraires : au — o. La condition nécessaire et 
suffisante pour qu’une matrice soit nulle est que tous ses éléments 
soient nuis. 

Nous désignerons par matrice unité , et nous écrirons i ou E 
(Einheit, en langue allemande), une matrice qui appliquée à un vecteur 
quelconque ne le modifie pas. On voit immédiatement, par des considé- 
rations analogues aux précédentes, que la condition nécessaire et suffi- 
sante pour qu’une matrice soit égale à l’unité ,est que tous ses éléments 
soient nuis, sauf ceux situés dans la diagonale principale qui doivent être 
égaux à i ; plus simplement 

<lik— <>/*. 

Produit de deux matrices (pu opérateurs). — Multiplier un vecteur 
par un nombre s, ( Xi = s ci)-, c’est lui appliquer la matrice scalaire 

s o ... o 

S = = Il s ou- 1|. 

o o ... s 

La matrice A étant un opérateur linéaire, nous avons 

*.AX=-A(jX), 

et ce vecteur est obtenu à partir du vecteur X par la matrice 

s A = Ai — |] 

que l’on appelle produit de la matrice À par le scalaire s. Evidemment 
i .A = A. 1 = A. 

Après avoir défini le produit d’une matrice par une matrice scalaire, 
nous allons définir le produit de deux matrices quelconques , soient 

A = || «u ||, 

B = [1 bu ||. 

Si à un vecteur quelconque X, nous appliquons l’opérateur A, nous 
obtenons 

Y = AX ; 

si à ce nouveau vecteur nous appliquons l’opérateur B, nous obtenons 


Z = BY = BAX. 
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L’opération faisant passer de X à Z est linéaire; elle est obtenue par 
une matrice C, qui est dite produit à gauche de la matrice A par la 
matrice B et se représente par 

G = BA (à lire de droite à gauche). 

Calculons l’expression de cette matrice 

fi 

k 

Zi =2 b l} y h 
i 

c’est-à-dire 

zi =2 a i kXk = 2 a? *2 biiajk : 

J t k j 

ce qui nous conduit à 

ça =2 «i jbjk- 

i 

Règle. — Pour multiplier deux matrices , on multiplie terme à 
terme les lignes de la première par les colonnes de la seconde afin 
d’obtenir un élément du produit. 

Il en résulte que, comme l’avait vu Cauchy, 

(dét B A) = (dét B) x (dét A); 


le déterminant de la matrice produit est le produit des déterminants. 

Le produit de deux matrices n’est pas , en général, une opération 
commutative . Considérons, par exemple, 


nous aurons 
tandis que 



Donnons un autre exemple de nature géométrique. La symétrie par 
rapport à un point est une opération linéaire représentable par une 
matrice; soit À la matrice représentant une symétrie par rapport au 
point Ai et, de même, B la matrice représentant une symétrie par 
rapport au point B*. La succession des deux symétries A et B est équi- 
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valente à la translation 2 A* B, et se représente par la matrice BA, 

tandis que la translation 2 B 1 A* , différente de la précédente, se représente 
par AB. 

Mais si nous considérons les symétries par rapport à deux droites 
rectangulaires, ce sont des opérations linéaires permutables; puisque 
leur succession équivaut à une symétrie par rapport au point de 
rencontre des deux droites. Le produit des deux matrices correspondantes 
est commutatif ; nous dirons alors que ces deux matrices sont permu- 
tables. Si l’une des deux matrices est un nombre, autrement dit une 
matrice scalaire, il y a toujours permutabilité, ainsi que nous l’avons 
déjà montré. 


Fig. 1. 

M M' 



Le produit de plusieurs matrices est une opération associative, c’est- 
à-dire que l’on a 

C(BA) =s (CB ) A = CBA. 

Cette propriété peut se vérifier par le calcul et l’on obtient comme 
résultat commun ( 1 ) 

djk — ^ cijbjiau, 

ht 

mais la chose est évidente : considérons un vecteur X et appliquons-lui 
successivement les opérateurs A, B, C. Nous obtenons CBAX; mais il 
revient au même de lui appliquer A et B puis C, c’est-à-dire (BA), 

(*) E11 effet 


~~ | bjl ai k 

et C ( B A ) = jj £ c,£ b tl a lk 

i < 

et de même 




et (CB) A = Il 2 a ik I 

1 ~ I ^ V Cubain il 

Il f 

Il t \ i J 1 
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puisC et nous obtenons C(BA)X ou bien À puis (CB); et nous obtien- 
drions (CB)AX. Nous avons donc, quel que soit X, 

C(BA)X = (CB)AX = CBAX, 

c’est-à-dire, par définition même, l’égalité des matrices C(BA) et(GB) A. 
Le produit est distributif par rapport à l’addition, c’est-à-dire que 

( A -h B)C = AC -b BC 
et 

C(A + B)= CA h- CB. 

Ici encore ces résultats peuvent se vérifier par le calcul, mais ils sont 
presque évidents : au vecteur Y = CX appliquons d’une part A -h B 
et d’autre part A et B; sommons ces deux vecteurs; d’après la définition 
même de la somme de deux matrices nous obtenons (A -4- B) Y = Al 4- B Y , 

e B)CX = ACX -+- BG\ =(AC -+- BC)X, 

pour un vecteur quelconque X, soit 

(A + B)C = AC+ BC. 

Remarquons que 

A x o = o x A — o, 

A + o - o + A = o. 

Et surtout notons bien le fait suivant : AB = o n entraîne pas néces- 
sairement A = 0 ou B = o; par exemple, le produit de deux matrices 


I 0 

, B = 

0 0 

0 0 


0 1 


est AB = o. Géométriquement : dans le pian, A représente la projection 
du vecteur sur le premier axe (parallèlement au deuxième axe), B sa 
projection sur le second (parallèlement au premier axe). La suite de ces 
deux opérations conduit à o quel que soit le vecteur d’où nous soyons 
partis. 

Mais, dans le cas où le déterminant de A n’est pas nul , la relation 
AB = 0 entraîne B = o. En effet on a 

ABX = o quel que soit X, 
et, si nous posons Y = BX, 

AY = o, 

qui, d’après l’hypothèse sur le déterminant de A, entraîne nécessaire- 
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nient Y = o; par conséquent BX est nul, quel que soit le vecteur X, 
autrement dit B = o. 


Puissances d'une matrice. — Par définition, nous poserons 

À 1 = À et A 0 = 1 ou E, 

A* = A 1 .A = AA, 

A :i =A 2 .A = AAA, 


A'«-i . A — AA ... A, 

ni facteurs 

Puisque nous savons définir une puissance positive quelconque de 
matrice, nous sommes en mesure de définir un polynôme par rapport à 
une matrice. Soit le polynôme 

i» — 0 

Nous pouvons calculer sans aucune ambiguïté 

h 

r~0 

A désignant une matrice. Remarquons qu’il n’en serait pas de même 
pour un polynôme à deux variables 

1 > (5, 

dans lequel nous substituerions aux deux variables, deux matrices; 
l’expression P (À, B) ne serait bien définie que si les deux matrices A 
et B était permutables. 


4. Quelques opérateurs ou matrices particuliers. — a. On appelle 
matrice diagonale , une matrice dans laquelle tous les éléments sont 
nuis, sauf ceux de la diagonale principale 


a 1 o 
O rt 2 


= I) «î* = 


Les matrices diagonales jouissent d’une propriété intéressante qui est 
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[a suivante : deux matrices diagonales sont permutables et leur pro- 
duit est une matrice diagonale ; vérifions-le : 


A = || afîik ||, 


B = , Mi* ||, 


AB = 


2 


ctihubihik 


|| nibilik ||. 


Nous aurions (Tailleurs pu le voir encore plus simplement en rev.enant à 
la définition des matrices : 

Y = BX, — btXi, 

Z — AY, z i = a i f h 
Z = ABX, zi = ctibiXi. 


b . On appelle matrice transposée A' d’une matrice A la matrice 
obtenue en permutant lignes et colonnes, soit 

A =|| a ik ||, 

A' = Il a tk || avec a' ik = a ki . 

On appelle matrice conjuguée A d’une matrice A, la matrice 
obtenue en remplaçant chaque terme par son conjugué, soit 

A = || II, 

A = || a ik |[. 

On appelle matrice associée A* d’une matrice A, la conjuguée de la 
matrice transposée de A, soit 

a =H «/*!!, 

A* = || a* k H, 

avec a\ k = a /a, A* = A'. 

Il est évident que chacune de ces trois opérations appliquée -deux fois 
successivement conduit à la matrice primitive : 

(A7=A, 

A = A, 

A** = A. 

Nous allons maintenant appliquer ces opérations à un produit de 
matrices ; nous avons 

AB = A. B, car ^ aqbjk âtjbjk- 
/ / 
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La conjuguée d’un produit est donc le produit des conjuguées. Pour 
les deux autres opérations, le résultat est un peu moins simple. 

Soient 

A = || (itk ||, donc A' = || a,* || avec = 

B = || but K, donc B' = ]] || avec $ lk = b k t\ 

et nous obtenons 


AB = 

donc 

et finalement 


Cik 


= 2 «// bik 


et B' A' = 


Vik 


=2 r ^ i * ik 


Y ik = ^ cikibu = 


Ckh 


(AB)' = B' A'. 


Par conséquent, pour calculer la matrice transposée d’un produit de 
matrices, il suffit de former les transposées de chaque facteur et d’en 
faire le produit en en renversant l’ordre. La même règle s’applique pour 
le calcul de la matrice associée; en effet prenons les conjugués des deux 
membres de la dernière relation obtenue 


(AB)* = B' A' = W A' = B* A*. 


c. On appelle matrice hermitienne une matrice qui est égale à son 
associée 


A = A*, soit an ~ a k i. 


Si la matrice est réelle, c’est une matrice symétrique. 

d. Nous verrons plus loin que les changements de coordonnées 
rectangulaires s’obtiennent par des matrices particulières que l’on 
appelle unitaires ; une matrice unitaire 1J est caractérisée par la 
relation 

UU* = i, 

soit, si U == || u lk || et U* = || u ik = uh ||, la condition 


2 UtjUkj ='àik- 
i 

Nous démontrerons que deux matrices C et D satisfaisant à CD = i 
sont permutables; donc une matrice unitaire est encore caractérisée par 
la relation 


U*U = 1 . 
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Par conséquent, si la matrice U est unitaire , il en est de meme de 
la matrice U* (rappelons que U** = U). 

Prenons les conjuguées des deux membres de la dernière relation, 
on a 

TH? = i 

et finalement 

~ÜÜ* aüs i. 

Donc, si la matrice U est unitaire , il en est de même de la 
matrice U [rappelons que (ü)* = (TJ*)] - 

Si au lieu de prendre les conjuguées, nous avions pris les matrices 
transposées, nous aurions obtenu 

ou 

lïW)* = i; 

donc, si U est unitaire , il en est de même de U'. 

5. Opérateur ou matrice inverse. — La matrice A, par la relation 

Y = AY, 

ou encore 

y t — o \ i X \ -4- Cl J o X-> Cl\n X„ } 

y t = a-nXx a 22 x t -4-. . ,-f -a in x, h 


yn — «n\X x ■+• ( tn-iX 2 -h ... -4- Ct, m X„, 


fait correspondre à un vecteur X de composantes x x , x n , un 

vecteur et un seul Y de composantes y x , y 2 , • . . , yn> Si le déterminant 
de la matrice A, soit |a// t -|, n’est pas nul ('), on peut résoudre par rap- 
port aux Xi ce système de n équations à n inconnues; et en désignant 
par A,/, le complément algébrique de an dans le déterminant, les formules 
de Cramer nous donnent 



k 


La matrice permettant de passer de Y à X se désigne par A -1 = [[«,/, || 
et se nomme matrice inverse ou réciproque de A; l’on a 



X sss A-' Y. 


(‘) Dét A^o signifie que les n vecteurs transformés de e n e t , . . ., e n par A (colonnes 
de A) sont linéairement indépendants. 
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11 csl clair que si nous appliquons successivement lu matrice A, puis 
la matrice A" 1 à un vecteur X, nous obtenons un vecteur Y puis le 
vecteur X. La succession de ces deux opérations équivaut donc à une 
identité, ce que l’on écrit : 

A-»A = i. 

Le même raisonnement, où Ton permute l’ordre dans lequel on applique 
les deux matrices A et A""', nous conduit à la relation 

AA-»=i. 

La vérification par le calcul de ces identités est facile. 

Le déterminant d’un produit de matrices est égal au produit des déter- 
minants de ces matrices, car dans la règle du produit de deux matrices 
on reconnaît la règle du produit de deux déterminants; par conséquent, 

dét (A) x dét ( A- 1 ) = i. 

6. Recherchons directement les matrices réciproques. Si la matrice A 
est singulière (si son déterminant est nul) elle ne peut avoir de réci- 
proque, c’est-à-dire qu’il ne peut exister de matrice B telle que 

Alt = i, 

sinon nous aurions la relation 

dét (A) x dét (B) = i, 

ce qui est impossible, puisque le premier facteur est nul. 


Fig. 2. 



Ces matrices singulières ou dégénérées jouent un rôle important, 
elles comprennent en particulier les projections. Exemple : 


o 

o 


A = 


Y = AY ; 


y*- = °- 
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Nous allons montrer qu'à une matrice dégénérée A, il est possible 
d’associer une matrice B non dégénérée telle que 

A = P.B, 

ou 

A = B.P, 

P étant une matrice de projection . 

Soit Y = AX qui symbolise l’ensemble des n relations suivantes : 

= a , | X | 4 - Cl \ 2 0C% 4- . . . 4- # i n &n > 
y % = « 2 |#1 -f- «22372 -+*. • .4- 


^/i — # /n *27 1 4“ Clrii^i 4- ... 4- &nn 

La matrice A étant supposée dégénérée, parmi ces n formes linéaires, 
r seulement sont linéairement indépendantes. Et par conséquent X 
décrivant E ;l , Y appartient à un sous-espace E,. à r dimensions seulement, 
ce que nous écrirons 

E,.= AE„. 

Nous allons montrer que l’on peut déterminer une matrice G telle que, 
dans ce sous-espace , AC = i , ce qui veut dire que la transformation AG 
se réduit à la transformation identique lorsqu’elle est appliquée à un 
vecteur du sous-espace. Pour faire cette démonstration, effectuons un 
changement de coordonnées tel que les r nouveaux premiers vecteurs 
coordonnés e K) e a , ..., e n appartiennent au sous-espace E,.. De ce 
choix, il résulte que chaque équation : 

ACi = £ i, 

AG 2 — 


A G>- — e r 

pour déterminer respectivement les vecteurs C 4 , C 2î . . . , C, est possible. 
D’autre part les équations 

AG r-hi = O, 

AC r+2 = o, 


AG n= O 

sont possibles, et les vecteurs C, + i, . . . , G rt peuvent être choisis linéai- 
rement indépendants, puisque le système homogène de n équations 
correspondant à l’équation AC; = o étant de rang r, admet un système 
fondamental de n — r solutions. C r +*, C r +2> . . . , C n forment donc une 
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base du système homogène, et la solution générale de chaque équation 
précédente en Ci, C 2 , ..., C r s’obtient en ajoutant à une solution parti- 
culière la solution générale du système homogène. L’ensemble des 
vecteurs 

Ci, C-2, . . , C r , Cr-M , • . • , C/i 

est linéairement indépendant, car s’il existait une relation 

Xi Ci -h X 2 C 2 -+- . . . -+- X r C r -+- X r -Hi Cr-^i -f- . . . -+- X„ C/, = o, 

elle entraînerait, en appliquant la matrice A, 

Xl<?l -h X 2 ^2-h . • . -h X r e r — O f 

ce qui exigerait X, = X 2 = . . . =l r = o, les ei étant linéairement indépen- 
dants; et puisque C r -M> . . C,i sont indépendants, on aurait de plus : 

Xr+l = X 7 .-f -2 — ■ • • — X/i ~ O. 

Entre les G/, une relation linéaire à coefficients non tous nuis est donc 
impossible; la matrice 

C = | Ci C 2 ... C/i b 

dont les colonnes sont constituées par les composantes des vecteurs C/, 
n’est pas dégénérée. Nous avons, par ailleurs, 

AG — | ACi AC*> . . . AC/i 

en utilisant toujours cette propriété très importante : les colonnes d’une 
matrice sont les composantes des vecteurs transformés des vecteurs 
coordonnés par la matrice. 

D’après les équations déterminant les Ci, on a donc 

AC = | e\ e% ... e r o o . . . 
ou, sous une forme plus développée, 



r 
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On voit que l’opération AG n’altère aucun des vecteurs e 1t . .., e r , et 
par suite respecte chaque vecteur de E,.. 

C’est un opérateur de projection, puisque son application à un vecteur 
revient simplement à annuler les n — r dernières coordonnées du vec- 
teur. Nous avons donc 

AG = P. 

La matrice G n’étant pas dégénérée, présente une inverse 

B = C-i 

qui n’est pas dégénérée et la dernière relation s’écril 

A = P. B, 

ce que nous voulions établir. Nous l’avons fait en changeant les axes 
de coordonnées, mais nous verrons plus loin que ce changement trans- 
forme une matrice A en une matrice S“'AS et le résultat que nous 
venons d’obtenir subsiste ( 1 ). 


7. Nous allons maintenant raisonner sur les matrices sans utiliser les 
déterminants. 

Soit la relation 

Y = AX. 


Si elle est résoluble en X par 

X = B Y, 


quel que soit Y, nous avons 
soit 


Y = ABY, 
AB = i. 


On dit que la matrice A n'est pas dégénérée et que B est sa réciproque 
à droite. Dans ce cas, où il y a une réciproque à droite, il n’y en a 
qu’une; supposons en eflfel qu’il y en ait deux B< et B 2 ; nous aurions 
alors 

ABt Y = Y, 

AB,Y = Y, 

soit, en soustrayant, 

A(Bi— B 2 ) Y = o pour tout Y. 

Or la matrice A n’étant pas dégénérée, d’après le théorème de l’aller- 


(') Nous pouvons imaginer aussi qu’on a dans tout ce qui précède raisonné sur les 
opérateurs géométriques A, C, P, B, .... La conclusion, établie dans un système de 
coordonnées particulières qui simplifie les calculs, est générale. 
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native, cette relation entraîne 

. (Bj — B 2 ) Y = o 
quel que soit Y, c’est-à-dire 

Bi=B 2 . 


Si B est la réciproque à droite de A, elle en est aussi la réciproque à 
gauche, c’est-à-dire que 

AB = i 

entraîne 


BA =i. 

Voici la démonstration de Tœplitz : partons de la relation 


AB = i. 


multiplions à droite par A les deux membres : 

ABA = A. 


Soit 

et, en ajoutant AB — i 


A(BA — i) = o 


il vient 

A ( B A -h B — i ) = i . 


La matrice B -h BA — i serait donc une réciproque à droite de A; 
B étant la seule réciproque à droite, nous avons 

B A = i. 


En résumé, étant donné une matrice, deux cas sont possibles : 

Ou bien elle ne présente pas de matrice réciproque, auquel cas elle 
est dite dégénérée; 

Ou bien elle en présente une qui est alors unique et réciproque à 
droite et à gauche. 

Ces résultats ne s’appliquent pas aux matrices infinies et nous verrons 
qu’au lieu de ces deux cas, quatre peuvent se présenter : 

Une réciproque unique à droite et à gauche ; 

Aucune, ni à droite, ni à gauche; 

Aucune à droite, mais une infinité à gauche; 

Aucune à gauche, mais une infinité à droite. 


8. Les quatre matrices A, A', A, A* sont simultanément dégénérées ou 


JULtA 


5 
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non. — Cela résulte immédiatement de la considération de leurs déter- 
minants qui sont simultanément nuis ou non. 

Si A présente une inverse, il en est donc de même des matnices A', À, A* 
et ces inverses sont en relations simples avec la première : 

AA-*=r; 


prenons les transposées des deux membres : 


soit 


(A-*)'.A'=i, 
(A')i = (À 


Et de la même façon nous prouverions que 

(à)-i=(i=ï), 

(A*)-i=(A -*)* 

Envisageons maintenant deux matrices A et B non dégénérées, leur 
produit n’est pas dégénéré, ainsi qu’il résulte immédiatement de la con- 
sidération des déterminants correspondants, et présente donc une réci- 
proque; je dis que 

(AB)-*= B-iA-i. 

Il faut prouver que 

B -1 A -1 AB = i, 


ce qui est évident, car A~~* A = i et il reste B^B — i, satisfaite par la 
définition même des matrices réciproques. On voit facilement que cette 
démonstration s’applique à un produit d’un nombre quelconque de 
facteurs, d’où la règle : pour prendre la réciproque d'un produit de 
matrices , on prend la réciproque de chaque facteur et on en inverse 
V or dre. 

Par conséquent 

(A")-i=(A-i)*, 

que, par définition, on écrit A - /*. Nous avons donc à l’heure actuelle 
défini les puissances entières positives et négatives des matrices ; il est 
aisé de vérifier qu’elles satisfont aux règles de calcul ordinaires des 
exposants. 

Enfin, remarquons que les matrices unitaires déjà définies sont les 
matrices dont l’associée est égale à la réciproque. 


9. Matrices non carrées. — C’est une notion utile mais non pas 
indispensable, les matrices non carrées pouvant se ramener à des 
matrices carrées par adjonction de lignes ou de colonnes de zéros. 
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Une matrice carrée transforme linéairement un espace en général 
en un autre espace E n ; imaginons une transformation linéaire d’un 
espace E m dans un espace E n , qui, aux composantes # 4 , • • •> 

d’un vecteur X fasse correspondre les composantes y 4 , y 2 , . . y n du 
vecteur Y transformé; les y sont des fonctions des x qui ne sont autres 
que des formes linéaires (à cause du caractère linéaire de la transforma- 
tion), soit 

m 

pour * =i ’ 2f 

/— L 

que l’on écrit symboliquement 

Y = AX; 

A = ||a/* || est une matrice non carrée à 11 lignes et m colonnes. 

De même que pour les matrices carrées nous dirons que : 

Deux matrices sont égales si elles font correspondre à un vecteur 
quelconque le même transformé, ce qui exige que les éléments corres- 
pondants de ces deux matrices soient égaux, condition évidemment suffi- 
sante. 

Le produit d’une matrice par un nombre est la matrice obtenue en 
multipliant chaque élément par ce nombre. 

Une matrice S est dite la somme do deux matrices A et |B, si elle 
transforme un vecteur quelconque en la somme de ses transformés par la 
matrice A et par la matrice B; on a la somme de deux matrices 
ayant le même nombre de lignes et de colonnes par 

sa- = Uik-h bik . 

Définissons encore le produit de deux matrices : 

Soient une matrice A transformant un vecteur X de E„ t , en un vec- 
teur Y de E /t : 

Y = AX, 

et une matrice B transformant un vecteur Y de E„ en un vecteur Z 
de En : 

Z = BY. 

La transformation permettant de passer de X de E w à Z de E^ est linéaire 
et s’obtient par la matrice G — BA : 

Z = CX. 

Calculons les éléments de la matrice G en explicitant les relations 



m 

précédentes : 
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yi^^QikXk pour #=i,a, 

A— l 
n 

pour / = i, 2, . . . , p, 

1=1 

soit 

n ni 1 n / n \ 

atk ) xk > 

i = 1 X— 1 A—i \ /=t y 

d’où le terme général de la matrice C : 

« 

cik = '£b/ i a i i. 
i—l 

Et l’on dit (d’une façon concise) que pour effectuer le produit BA, on 
multiplie chaque ligne de B par chaque colonne de A. Remarquons que 
le produit de deux matrices BA n’a de sens que si le nombre des 
colonnes de B est égal au nombre de lignes de A. 

Ainsi que nous l’avons signalé au début de ce paragraphe, la notion 
de matrice non carrée n’est pas indispensable, mais elle est utile. En 
effet : 

i° Nous avons montré déjà que la i [ème colonne d’une matrice carrée 
est le vecteur transformé par cette matrice du £ ôme vecteur coordonné. 
Considérons un vecteur X de E m comme une matrice à m lignes et une 
colonne, soit 

^1 

x= ^ 

OC ni 


et de même un vecteur Y de E„ comme une matrice à n lignes et à une 
colonne, soit 


La relation 



se traduit par 


: AX 


yi^^>a ik Xk pour * = I,2, 
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et par conséquent peut être considérée comme une relation entre 
matrices non carrées, ÀX étant le produit des matrices A et X. 

2 0 Considérons alors la matrice A qui fait passer d’un vecteur X de E,„ 
à un vecteur Y de E n : 

Y = AX 

et changeons de coordonnées, dans chacun de ces deux espaces, par les 
deux matrices S et T non dégénérées : 

X = SE, 

Y = TH. 

Par quelle matrice X s’exprime l’opérateur A dans ce nouveau sys- 
tème de coordonnées ? 

Y = AX nous donne 

TH = ASE. 

La matrice T n’étant pas dégénérée, la matrice T -1 existe; multiplions à 
gauche par T“' les deux membres delà dernière relation, il vient : 

H = T ” 1 ASE. 

Et par conséquent, la nouvelle matrice correspondant à l’opérateur A est 

a = T-' AS. 

T“‘ a 11 lignes et n colonnes. A a n lignes et m colonnes, Sam lignes 
et m colonnes et (X a bien n lignes et m colonnes. 

10 . Décomposition des opérateurs ou matrices. — Revenons aux 
matrices carrées A transformant linéairement l’espace vectoriel à n 
dimensions en lui-même et supposons que nous connaissions un sous- 
espace linéaire à E' à n r dimensions qui soit invariant par la matrice A, 
c’est-à-dire tel que si l’on choisit arbitrairement un vecteur X de E', son 
transformé Y = AX appartienne aussi à E' (ce que nous avons eu l’occa- 
sion d’exprimer de la façon suivante : AE' est identique à E' ou est 
contenu dans E'). Nous décomposerons alors E en deux sous-espaces 
dont l’un est E' et l’autre son complémentaire E" à n ,f = n — n' dimen- 
sions; puis nous adapterons le système de coordonnées de E à celte 
décomposition, autrement dit nous choisirons les n ' premiers vecteurs 
coordonnés dans E'et par suite les //autres dans E". La matrice relative 
à ce nouveau système de coordonnées prend une forme plus simple, car 
les n f premières colonnes représentant les vecteurs transformés des n' 
premiers vecteurs coordonnés (de E’) ont leurs n !f dernières lignes nuilcs 
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(les transformés appartenant également à E'). 



Un vecteur de E' se transforme en un vecteur de E' par la matrice A, 
à n' lignes et n’ colonnes qui est dite induite dans E' par la matrice A. 
L’espace projection 3 de E suivant E' peut être défini par les n ,r dernières 
coordonnées; les vecteurs transformés par A des n!' derniers vecteurs 
coordonnés ont pour composantes les éléments des n!' dernières 
colonnes. Mais les projections sur & de ces transformés ont pour com- 
posantes les éléments des rc" dernières colonnes limitées aux n !l dernières 
lignes (colonnes de A 2 ). De telle sorte que l’on peut dire : A induit dans 3 
une transformation linéaire définie par la matrice A a ; ou bien si St et 
sont les projections sur 3 de X et Y liés par Y — AX, ils sont liés par 
la relation 

Précisons un peu ceci; un vecteur quelconque X est la somme d’un 
vecteur de E' d’un vecteur de E" : 


X = X -+- X". 

Appliquons l’opérateur A : 

AX = AX'-h AX # ; 


or AX' appartient à E'; donc la projection sur E", parallèlement à E', 
de AX est la même que celle de AX", transformé d’un vecteur appar- 
tenant à E", (AX)"== (AX")"; la définition de A 2 exprime en outre 
que (AX")" = A 2 X"; par conséquent, si nous décomposons de même le 
vecteur Y : 

Y = Y'+Y J , 

nous obtiendrons 


Y*= A 2 X". 


En général E" n'est pas un sous-espace invariant par l'opérateur A; 
dans le cas particulier où il l’est, il est clair que la matrice A se simplifie 



ut prend la forme 
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On écrit quelquefois 

A = Ai h- Aj 

et l’on désigne cette opération par somme directe . 

Ces résultats peuvent se généraliser. Supposons l’espace E, décomposé 
en E', E", . . . , sous-espaces invariants à n f , n ", . . . dimensions. Si nous 
adaptons le système de coordonnées à cette décomposition, la matrice se 
décompose en matrices carrées se succédant le long de la diagonale 
principale, ainsi qu’on s’en assure immédiatement en utilisant l’interpré- 
tation des colonnes d’une matrice, les éléments autres que ceux de A ( , 
A 2 , A;,, ... étant nuis, 



Ceci n’est plus vrai si les E', E", ... ne sont pas invariants par A. 
Mais, de même que dans le cas simple de deux sous-espaces, nous 
pouvons envisager ce cas général où E est décomposé en sous-espaces 
E', E", ..., E< a >, . ..,*E^>, ... et où le système de coordonnées est 
adapté à cette décomposition. Considérons un vecteur X de E ( ^ et son 
transformé Y = ÀX par la matrice A; projetons-le sur E (a) parallèle- 
ment à l’ensemble des sous-espaces autres que E (ûl) . Nous effectuons 
ainsi une transformation linéaire (à déterminant nul) qui nous conduit 
à Yf*>. En définitive, nous avons réalisé une transformation linéaire qui, 
à un vecteur X de E ( P), fait correspondre un vecteur Y*®) de E<“J; elle est 
représentée par une matrice [A] a 3 à n a lignes et n$ colonnes que nous 
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pouvons mettre en évidence dans la matrice A : 





Les np vecteurs de base de EM se transforment par A en np vecteurs 
dont les coordonnées sont des colonnes de la matrice A; les coordonnées 
de leurs projections sur EM s’obtiennent en ne conservant que les n a lignes 
relatives aux composantes sur les vecteurs de base de EM et en rempla- 
çant les autres par des zéros. Finalement, la matrice [A ] a 3 à n a lignes 
et np colonnes peut être prélevée dans la matrice A en ne gardant que 
les w a lignes correspondant aux coordonnées relatives aux vecteurs de base 
de E (a) et les wp colonnes correspondant aux transformés des vecteurs 
de base de EM et en annulant tout le reste. 


II. — TRANSFORMATION DES MATRICES. 
ÉQUIVALENCE DANS LE GROUPE LINÉAIRE HOMOGÈNE. 


1. La transformation d’une matrice (ou opérateur) donnée A peut être 
envisagée de deux manières : 

Ou bien, conservant toujours le même opérateur géométrique , nous 
changeons les axes de coordonnées, ce qui modifie la matrice corres- 
dante ; 

Ou bien, nous soumettons l’espace dans lequel opère A à une trans- 
formation linéaire non dégénérée et nous cherchons l’opérateur trans- 
formé dans le nouvel espace. 


Premier point de vue . — L’opérateur donné transforme un vecteur X 
en un vecteur Y : 


Y = AX; 


faisons le changement 4e coordonnées, défini par la matriceS (régulière) : 

x = sa, 

Y = SH ; 



nous obtenons 
soit 
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Dans le nouveau système de coordonnées, l’opérateur s’exprime donc 
par la matrice : 


d = S-*AS. 


qu’on appelle transformée de A par S. 

Nous verrons plus loin qu’on peut choisir S, c’est-à-dire les nouveaux 
vecteurs coordonnés de façon que Cl soit plus simple que A. C’est ce 
qui fait l’importance du point de vue actuel. 

Les deux matrices A et Cl correspondent au même opérateur géomé- 
trique sous des vêtements analytiques différents . Si S est une matrice 
quelconque régulière, les deux matrices A et S"‘ AS sont dites équiva- 
lentes dans le groupe linéaire homogène . 

Deuxième point de vue. — Effectuons sur l’espace E„ où opère A 
une transformation linéaire non dégénérée définie par la matrice S : 

# = SX, 
y = SY. 

La relation entre X et Y étant linéaire, celle qui relie SC et le sera 
aussi. Et nous aurons la relation 


soit 

ou 


Donc 


y = eue, 


SY = as\ 

Y S-1CXSY = AY. 


A = s- 1 Cl S. 


Donc l’opérateur transformé de A dans le nouvel espace s’exprime par 
la matrice 

a = SAS-i. 


On peut dire que Cl est une image de A dans le nouvel espace. 


2. Nous dirons que deux matrices A et B sont équivalentes, lorsqu’il 
est possible de trouver une matrice S, non dégénérée, telle que 

B = S -1 AS. 

L’ensemble des matrices ainsi transformées de la matrice A forme une 



CHAPITRE II. 


74 

classe de matrices équivalentes dans le groupe homogène linéaire. 
Deux matrices de la même classe sont équivalentes; en effet 

B = S -1 AS ou A=SBS-\ 

G = T - 1 AT, 

qui peut s’écrire 

G = T-* SBS-i T = ( S-* T )-i B ( S-* T ) ; 


donc B et G sont équivalentes. De même, une matrice équivalente à une 
matrice de la classe appartient à la classe. La condition nécessaire et 
suffisante pour que deux matrices soient équivalentes est donc que les 
deux classes associées à chacune soient identiques. 

Une classe est connue lorsqu’on en connaît une matrice; autrement 
dit à une matrice on peut faire correspondre une classe. Parmi toutes 
les matrices d’une classe, nous allons essayer d’en choisir une, la plus 
simple possible , de telle sorte qu’à une classe on puisse faire correspondre 
une matrice qui la caractérise. Cette matrice est équivalente à une 
matrice quelconque de la classe et en est appelée matrice réduite ou 
canonique . Il devient alors plus aisé de rechercher si deux matrices 
sont équivalentes : 

La condition nécessaire et suffisante pour que deux matrices soient 
équivalentes est qu’elles aient même forme canonique ou réduite. 

On peut dire encore que toutes les matrices d’une classe sont les diffé- 
rentes malrices par lesquelles s’exprime un même opérateur géométrique 
dans les divers systèmes de coordonnées. 

Les coefficients delà matrice canonique sont des fonctions très impor- 
tantes de la matrice A d’où l’on est parti; ces fonctions prennent même 
valeur pour toutes les matrices de la classe de A; nous mettons ainsi en 
évidence les invariants de la matrice A dans les transformations S“' AS, 
S appartenant au groupe linéaire homogène. 

Nous avons supposé que S est une matrice régulière arbitraire, 
et ceci nous a conduit à une forme canonique dans le groupe des 
transformations de la géométrie homogène linéaire et aux inva- 
riants d’une matrice dans ce même groupe de transformations. Mais on 
peut avoir à s’occuper de groupes de transformations plus restreints 
(par exemple, le groupe des rotations autour de l’origine), la matrice S 
est alors soumise à certaines conditions (dans cet exemple, relations 
entre les cosinus directeurs); la matrice canonique que l’on peut alors 
obtenir se différencie de la précédente. 

Nous allons nous placer dans la géométrie homogène linéaire et par 
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conséquent prendre pour S la matrice régulière la plus générale; mais il 
était essentiel de remarquer que la forme canonique et les invariants 
dépendent du groupe de transformations que Von considère . 


3. Avant d’aborder le problème, démontrons quelques lemmes. 

a . A ayant pour transformée S"" 1 AS, A n a pour transformée 

(S - 1 A» S =(S-iAS)«. 

La vérification par le calcul est immédiate : 

(S-*AS)”= S- tAS.S- 1 AS.,.S- 1 A S. 

n fols 

Tous les SS -1 = 1 intermédiaires disparaissent et il reste 

(S-»ASy*= S-1 A" s. 

Géométriquement, la chose est évidente : A" correspond à n fois la 
transformation A qui, après changement d’axes, donne n fois la transfor- 
mation S -1 AS ou bien S -, A n S. 

Les transformés des puissances sont les puissances du transformé . 

b. Si la matrice A a une réciproque A“‘, nous avons aussi 

( S -1 AS ) -1 = S _l A ” 1 S 

d’après la règle donnant la réciproque d’un produit. 

Donc prendre la réciproque d'une matrice et prendre sa transfor- 
mée sont deux opérations permutables . 

c. Les deux systèmes homogènes : 

AX = o, 

( S -1 AS) Y = o 

ont le même rang, c’est-à-dire le même nombre de solutions linéairement 
indépendantes. En effet, posons Y = S -1 X; la deuxième équation devient 

S-* AX = o, 

c’est-à-dire 

AX = 0 (car dét S o) 


et la correspondance linéaire biunivoque Y = S 1 X entre les racines 
conserve l’indépendance linéaire. 



CHAPITRE II. 


76 

d . Si F(æ) désigne un polynôme, nous savons calculer celte expres- 
sion lorsqu’on y remplace x par une matrice; sachant que la transformée 
d’une somme de matrices est la somme des transformées et que la trans- 
formée d’une puissance est la puissance de la transformée, nous en 
déduisons 

F ( S -1 AS ) = S -1 . F ( A ). S. 

e . Notons enfin que dét (S -1 AS) = dét(SAS“') = dét A ; on retrouve 
le déterminant de A comme premier invariant. 


4. Étant donnée une matrice A, cherchons s’il y a des vecteurs qui 
soient parallèles à leurs transformés par la matrice A ( directions inva- 
riantes); ce qui revient à chercher un vecteur X tel que 


soit 

X représentant la matrice : 


AX = XX, 

(X — À)X = o, 


X o ... o 
o X ... o 

0 o ... X 


Pour que. l’équation (X — A)X = oait des solutions X non nulles, il 
faut et il suffit que la matrice X — A soit dégénérée, c’est-à-dire que son 
déterminant soit nul; X doit donc être racine de l’équation 

/( X ) = o, 


y(X) étant le polynôme caractéristique (*) : 


AX): 


X — «, 1 

~ «12 

« 1 3 ... 

— «IM 


— «2, 

X 

«23 

«2 M 


— «31 

«32 

X «33 

«3M 

= 

— «ni 

««2 

— «rt3 

X «mm 


/(>-) = 

X« — J, X» 

- 1 -t- X "- 2 -4- . 

• .+ (-1) 

n S n « 


= dét ( X — A ). 


Si X est un zéro de ce polynôme, l’équation (X — A) X = o présente une 
racine X non nulle au moins. Les racines de /(X) = o s’appellent les 


(*) Voir dans Cauchy, Œuvres , vol. 11, pages 75 - 1 33, l’introduction de cette notion 
pour l’étude des singularités des équations différentielles. 
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valeurs caractéristiques ou valeurs propres de A (les Allemands disent 
Eigenwert), et les solutions X correspondantes : solutions propres 
(Eigenlôsung). 

Montrons que f(l) est invariant par un changement de coordon- 
nées. En effet, considérons 

/(X) = dét(X-&), 

soit 

/(X) = dét(X — S-iAS). 

Remarquons que Xï=S~'XS (d’après le sens géométrique de la matrice 
scalaire X) ; donc 

/( X ) = dét(S _ 1 XS — S-i AS ) = dét [ S-i ( X - A ) S ], 

ou bien 

/( X ) = dét ( S-* ) dét( X — A ) dct ( S ) = dét ( X — A ). 

Donc le polynôme caractéristique de deux matrices équivalentes est le 
même; par conséquent les racines de l’équation caractéristique sont 
invariantes par rapport aux transformations linéaires et homogènes, 
ainsi que les expressions s A , s 2 , . .., s n qui sont des polynômes par 
rapport aux éléments de la matrice. En particulier : 

s, n déterminant de A, est un invariant. 

Le plus important de ces invariants est 

Si — «il -H «22 H- «#*« — A), 

que l’on appelle trace (Spur) de la matrice A. Puisque la trace est une 
fonction linéaire des éléments, la trace de la somme de plusieurs 
matrices est la somme des traces de ces matrices. D’autre part, consi- 
dérons une matrice A = || a/* ]| à n lignes et à m colonnes qui transforme 
l'espace E m en un espace E n et une matrice B qui transforme l’espace E /t 
en toutou partie de l’espace E /n ; B aura m lignes et n colonnes (certaines 
lignes pouvant n’ètre formées que de zéros). La matrice BA, à m lignes 
et m colonnes, transforme linéairement E m en tout ou partie de lui- 
même. Et nous avons 

n m 

«( AB)=22 0< * 6i '’ 

f = 1 *=1 
m n 

*< ba)=22 bu-aki. 

*=i k = i 


Donc 


C(AB) = «(BA). 
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5. Une théorie complète des invariants numériques de A par rapport 
au groupe homogène linéaire se ramène à celle des formes canoniques 
ou réduites de Jordan par rapport à ce même groupe ( 1 ) et dépasse notre 
programme ; celle des invariants géométriques de l’espace lui est liée ( 2 ). 
Elle met en jeu la méthode des diviseurs élémentaires de Weierslrass; 
nous allons simplement en donner une idée. 

Si l’équation /(X) = o a ses n racines distinctes, à la racine X,- corres- 
pond un seul vecteur X* (à un scalaire près); nous prouverons que ces n 
vecteurs X; sont linéairement indépendants et peuvent par conséquent 
être pris comme vecteurs coordonnés; puisque nous avons 

A X, = XX,, 

la matrice se réduit alors à 


Xt 

0 

. 0 

0 

x 4 . 

. 0 

u 

o 

X„ 


Mais il est clair que les racines caractéristiques ne sont pas toujours 
distinctes; dans ce cas nous emploierons une méthode d’Hermann 
Weyl ( 3 ) développée par Schreier et qui conduit aux résultats de 
Jordan. 


III. - NOTIONS SUR LES FORMES CANONIQUES 
OU RÉDUITES DE MATRICES 

DANS LE GROUPE LINÉAIRE HOMOGÈNE. RÉDUITE DE JORDAN. 


1. Supposons que l’espace E se décompose en deux sous-espaces 
complémentaires E< et E 2 , tels que chacun soit invariant par l’opéra- 
teur A. Si nous adaptons le système de coordonnées à cette décomposition 
de l’espace, nous avons vu que la matrice correspondante prend la 
forme 


A = 


A, ! o 

1 ; 

o | A 2 


( 1 ) Voir Jordan, Traité des substitutions . 

(*-) Voir Schreier et Sperner, Vorlesungen über Matrizen; Mac Duffee, The Theory 
of matrices. 

( 8 ) II. Weyl, Mat. Anal, der Raumproblems (Springer, 1933). 
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que Pon écrit symboliquement 

A = At 4- A*; 

A* et Ai s’appellent les opérateurs induits par A dans les sous-espaces 
Ef etE 2 . Il est clair que le polynôme caractéristique prendra alors la forme 


X- Ai 


./(*) = 



fi (X) = dél(X — Ai) représentant le polynôme caractéristique de l’opé- 
rateur A* dans l’espace E<, et/ 2 (X) = dét(X — A 2 ) le polynôme carac- 
téristique de l’opérateur A a dans l’espace E 2 . Développons ce déterminant 
par la règle de Laplace (- 1 ), relativement aux r premières colonnes, 
r désignant le nombre de dimensions de E< ; le seul mineur formé à 
l’aide de ces r premières colonnes, qui ne soit pas nul est, 

dét ( X — Ai) =/i( X), 

et son déterminant complémentaire est 

dét (X — À 2 ) =/* (X), 

d’où la relation 

/(X) =/i(X) x / ï(X). 

Nous avons donc montré que si V espace donné se décompose en deux 
sous-espaces invariants par A, le polynôme caractéristique se décom- 
pose en un produit de polynômes , qui sont les polynômes caractéris- 
tiques des opérateurs induits par A dans les deux sous- espaces. 

2. Ce théorème présente une réciproque qui est très importante : 

Si le polynôme caractéristique relatif à un opérateur A se 
décompose en deux facteurs premiers entre eux , dont les premiers 
coefficients sont égaux à V unité, V espace se décompose en deux sous- 
espaces disjoints ( ’ 2 ) invariants par V opérateur A. 


( 1 ) C’est une généralisation du développement classique par rapport aux éléments 
d’une colonne; on développe ici par rapport aux mineurs formés par p colonnes détei* 
minées. 

(*) C’eslyà-dire n’ayant en commun que le vecteur nul. 
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Nous allons d’abord établir quelques lemmes : 

Premier lemme. — C’est seulement pour les racines X = X 0 de l’équa- 
tion caractéristique /(À) = o, relative à A. qu’il existe des vecteurs X 
non nuis satisfaisant à la relation 

AX = XX ou (X — A)X = o. 

Réciproquement, si X = X 0 est racine de /(X) = o, celte relation 
(X 0 — A) X = o définit une multiplicité linéaire de vecteurs X. 

Ce premier lemme est tout simplement la définition de l’équation 
caractéristique. 

Deuxième lemme . — Etant donnée la matrice A, formons son équa- 
tion caractéristique /(X), puis la matrice f{ A); nous allons montrer 
que cette matrice appliquée à un vecteur arbitraire X le transforme 
en o. autrement dit que /(A) = o. Ce théorème est dû à Hamilton - 
Cayley. Soit 

/(X) = dét (X — A) = | X8*/ — a ti |, 


et désignons par 6i*(X) le complément algébrique (*); dans ce détermi- 
nant de làki — an) ba(l) est manifestement un polynôme de degré n — i 
par rapport à X et nous pouvons écrire 

n — l 

V=0 

La matrice 

B(X) = |IMX)|| 


est appelée matrice adjointe de la matrice ||X — A||. 
Nous avons 

n—\ n— 1 n — \ 

bo)= 2^ v,xv =2 x wii=2 BMV ' 


en posant 
La relation 


B(v) = ||6<v>„. 

n — i 

v=o 


exprime la matrice B sous forme d’un polynôme en X dont les coefficients 


( l ) Nous disons indifféremment : complément algébrique ou mineur affecté de son 
signe. 
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sont des matrices. Formons alors le produit 


B(X)(X — A) = 


2 &//(X)(X8/* — a/*) 


l’un des éléments de cette matrice. 
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est le produit des éléments de la Â* ,ème colonne de dét(X — A) par les 
compléments algébriques des éléments de le i ièmc colonne. Il est donc nul 
si i est différent de A* et égal à dét(X — A) = /(X) si i est égal à A, soit 

B(X)(X — A) = ||3,*/(X)|| = /(A), 


y’(X) désignant une matrice scalaire. Nous avons ainsi obtenu une 
identité en X : 



(X — A ) = /( X ). 


Les deux membres sont des polynômes de- degré n en X. à coefficients 
matriciels. Nous pouvons y remplacer X par la matrice A; le premier 
membre s’annule et nous obtenons la relation cherchée 

/(A) = o.. 

'Cette élégante démonstration est à rapprocher de celles employées 
ordinairement dans la théorie des déterminants adjoints. 

La matrice A, opérant dans l’espace E,*, vérifie donc une équation 
algébrique de degré n; mais il peut arriver que A vérifie une équation 
de degré moindre. Parmi toutes ces équations il y en a une (si l’on 
impose au premier coefficient la condition d’être égal à l’unité) de degré 
minimum : son premier membre est appelé polynôme minimum de la 
matrice A, et l’on démontre que tout polynôme qui s'annule lorsqu'on 
y remplace la variable par la matrice A est un multiple du polynôme 
minimum. En particulier. /(X) en est un multiple. 

Nous sommes maintenant en mesure de démontrer la réciproque 
annoncée. 


3. Théorème fondamental. — Soit A une transformation linéaire 
de V espace E et /(X) le polynôme caractéristique correspondant ; 
supposons qu'il se décompose en un produit de deux polynômes f { (X) 


JULIA 
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et f 2 (X), premiers entre eux , dont les premiers coefficients sont égaux 
à r unité 

/(X)=/i(X)/ i (X). 

Dans ces conditions nous allons prouver qu'il existe deux sous- 
espaces E, et E 3 jouissant des propriétés suivantes : 

i° E* est invariant par A; il en est de même de E 2 . 

2 ° E, et E 2 sont disjoints , c'est-à-dire qu'ils n'ont que zéro comme 
vecteur commun . 

3° Ils sont complémentaires : E = E, + E 2 . 

4° f\ et f 2 sont les polynômes caractéristiques des transformations 
induites par A dans E* et E 2 . 

5° Enfin E, et E 2 sont déterminés d’une manière unique . 

D’après notre second lemme (Hamilton), l’espace E est défini comme 
formé par l’ensemble des vecteurs X satisfaisant à /(A)X = o. Par 
conséquent, si f K (X) est le polynôme caractéristique de l’opérateur 
induit par A dans E,, nécessairement E, sera défini par l’ensemble des 
vecteurs X tels que/^ (A)X = o, et de même E » sera défini par l’ensemble 
des vecteurs X tels que t /’ 2 (A)X = o. Ces relations définissent des 
espaces linéaires et la propriété (5) est bien vérifiée. 

Reste à voir ce que contiennent les espaces E< et E 2 ainsi obtenus. A 
cet effet, envisageons les espaces dh et d? 2 définis par 

= /a(A)E, transformé de E par f t ( A ), 

6 2 =/i(A)E, transformé de E par/ 4 (A). 

On a évidemment, d’après le théorème d’Hamilton-Cayley, 

== o, 

A ) = O. 

Donc E< contient dh et E 2 contient Nous allons montrer que E* est 
identique à et E 2 à <$ 2 . Remarquons que f K (X) et/ 2 (X) étant premiers 
entre eux, nous pouvons, d’après le théorème de Bezout, déterminer 
deux polynômes g K (X) et £a(X) tels que 

/i(X)^*(X)-h/ 2 (X)^ 1 (X) = I. 

D’où, en remplaçant X par la matrice A dans cette identité, 
/i(A)^ 2 (A)-f-/ 2 (A)^i(A) = i. 

a. Supposons que soit vide , autrement dit que / 2 (A)X soit nul, 
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quel que soit X. D’après la relation 

X=/i(A)* 1 (A)X+/ 1 (A)* t (A)X > 

puisque dans l’expression / 2 (A)^ (A)X, nous pouvons permuter les 
facteurs polynômes qui ne dépendent que d’un seul opérateur , nous 
avons f 2 (A)g { (A) X = o, donc 

X=/i(A)^(A)X=/ 1 (A)[^(A)X]. 

Par conséquent X appartient à &i ; puisque [^ 2 (A)X] est un vecteur 
deE; dans ces conditions E = d? 2 . La matrice A) transforme donc 
E en lui-même, autrement dit f { (A) X = o entraîne X = o : E, est vide. 
Et d’autre part, f 2 (A) X étant nul quel que soit X, E 2 est identique 
àE. 

En résumé, si & K = o, nous avons 

Si — Et = o, 

— E 2 = E. 

b. Supposons maintenant que ni & K ni & 2 ne soient vides; ces deux 
espaces sont disjoints en vertu de l’identité 

X = ^(A)/ 1 (A)X + ^ 1 (A)/,(A)X, 

appliquée à un vecteur X commun, pour lequel 

/i(A)X = o (car X est dans Si), 

/ 2 (A)X=o (car X est dans S 2 ), 

ce qui entraîne X = o. 

On a vu que E, contient &\ car d’après le théorème de Hamillon, 
/, (A) = o. De même E 2 contient d> 2 . Inversement, nous allons voir 

que contient E, ; en effet, un vecteur XdeE* satisfait à f\ (A) X = o, 
donc à 

X=/,(A)*i(A)X=/,(A)[*i(A)X] 

et par conséquent appartient à puisque gi (A) X est de E. Nous avons 
donc 

&\ = Ei, 

6, = E s , 

mais, en introduisant & K et S 2l nous avons l’avantage d’une définition 
explicite des sous-espaces. 

Un vecteur X quelconque se décompose 

X=/i(A)[^(A)X]-h/,(A)[^i(A)X] 
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en la somme d’un vecteur de E, et d’un vecteur de E 2 ; E4 et E 2 sont 
donc deux sous-espaces complémentaires . 

E < et E 2 sont invariants relativement à A ; soit en effet X un vecteur 
de E| ; il satisfait à 

/i( A) X = o, 

ou encore 

A/i ( A ) X = o, 

et en permutant l’ordre des facteurs, opération qui est légitime puisqu’il 
n’intervient qu’un seul opérateur A, 

/,(A)AX =o, 

ce qui nous montre que AX appartient à E 1 . 

Il nous reste à prouver que f K et / 2 sont les polynômes caractéris- 
tiques des transformations induites par A dans E, et E 2 . Désignons en 
effet par <p,- et cp 2 ces polynômes caractéristiques; d’après le théorème 
direct, nous avons 

/(X)== ? 1 (X) ? 2 (X). 


Dans le cas particulier où E, serait vide, nous poserions = i . Nous 
allons montrer que f\ et <p, ont les mêmes racines. Soit X 0 une racine 
de cp , (X ) = o ; nous avons 

/i(X) = (X — X 0 )^i(X) -h/i(X 0 ) 

en désignant par ^,(X) le quotient de f\(V) par X — X 0 . Remplaçons X 
par la matrice A dans cette identité 


/l ( A ) = ( A — X 0 )<];,( A ) -h fi ( Xo ). 


X 0 étant racine de cp 1 (X) = o, il existe certainement dans E 1 un vec- 
teur X 0 non nul tel que 

A Xo — X 0 Xo ; 


nous avons alors 


fi ( A ) X 0 — ^i( A) (A — Xo) Xo -4- fi ( Xo) Xo, 


Or/, (A)X 0 est nul, car X 0 appartient à E,. Il en résulte que 

<> =/i ( Xo) Xo, 

et X 0 n’étant pas nul, le scalaire / 4 (X 0 ) = o. Toutes les racines de 
appartiennent à /, premier avec / 2 ; donc et / 2 sont premiers et, 
puisque 


fi A ~ ?i?i> 
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<p< divise f t . Or de même <p 2 et f K sont premiers, donc /, divise 
Finalement /, et <p< ne peuvent différer que par un facteur constant. 
Mais ces polynômes ayant tous deux i comme premier coefficient, nous 
avons 

A = ?i, 


et de même 


/* — ?*• 


i. En appliquant le théorème fondamental de proche en proche, nous 
pouvons V étendre à un nombre quelconque de sous-espaces. Soient 
p 2 , . . . , pjt les racines distinctes de f(l) et n { , n 2 , . . ., n leurs ordres 
de multiplicité 

/( X) — (X — ^i) n i( X — tx 2 y*2 ... ( X — \kk) nk . 

Si nous posons 

fi — ( X — ;j.i )«* et /, = ( X — «x, )"* ... ( X — jj.*)' 1 *? 

nous mettons en évidence le sous-espace' E, défini par les vecteurs X 
tels que (A — jji, )’ h X == o et un sous-espace E', défini par f \ (A)X = o. 
Nous pouvons effectuer les mêmes opérations sur ce second sous-espace 
et ainsi de suite. .Nous mettons finalement en évidence d’une manière 
unique k multiplicités linéaires E,. E 2 . . . . E*. définies respectivement 
par 

(A — pi)*iX = o, 

(A — ( u 2 )"* X = o, 


(A — n*)”*X = o. 


Ces multiplicités sont non vides , disjointes , invariantes par A, leur 
ensemble formant une décomposition de l’espace E, et(/ — {jl ,)” 1 étant le 
polynôme caractéristique de la transformation A, induite par A 
dans E;, ce qui nous prouve que E* a m dimensions. Adaptons alors 
notre système de coordonnées à cette décomposition de l’espace en 
choisissant les vecteurs coordonnés 


<?1, 

e. 2) 

• » e n , 

dans E|, 


e n x - 4-2 > 

• t 

dans E 2 , 

Cn—nit 4-1 j 

Vn—Uk 4-2 > 

- 1 e n 

dans E*. 
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La matrice A prend alors la forme 


A t 

0 1 



0 

A 2 

0 







0 

A*-i 

0 


i 

1 

0 

A* 


ce dont on s’assure immédiatement, une colonne de la matrice étant 
formée des composantes d’un vecteur transformé d’un vecteur coordonné 
par l’opérateur A. A t est la matrice induite dans E* par A et a pour 
polynôme caractéristique (X — p) n *. Dans le cas particulier où /(X) a 
toutes ses racines simples, la matrice A est ramenée à la forme diagonale 


X, 

0 


0 

0 

0 

x. 


0 

0 

0 

0 

. . . 

X«— 1 

0 

0 

0 


0 

X„ 


Dans le cas général, nous pouvons encore choisir arbitrairement les 
vecteurs coordonnés à l’intérieur de chaque sous-espace E,, E a , ..., E*. 
Nous allons profiter de cette latitude pour simplifier encore la matrice A 
et la ramener à la forme canoniqne de Jordan ( 1 ). 

5. Nous nous proposons de simplifier la matrice A< de E* dont le 
polynôme caractéristique est ( X — /jt| ) /,a . Supprimons les indices pour 
abréger : dans un espace E à n dimensions nous avons un opérateur A 
qui, dans un certain système de coordonnées, s’exprime par une matrice A 
de polynôme caractéristique (X — p) n ; cherchons le système de coor- 
données, par rapport auquel la matrice prenne la forme la plus simple 
possible. 

La matrice A* = A — p (ne pas confondre avec la notation A< de tout 


(t) Ce problème est traité dans Jordan, Traité d } Analyse, III, à l’occasion des points 
singuliers des équations différentielles. Voir aussi H. Weyl, Math. Anal, des Raum- 
problems (Springer, 1923 ). 
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à l'heure) a pour polynôme caractéristique X n et est par conséquent 
dégénérée. D'après le théorème de Ilamilton, nous avons la rela- 
tion A"™ o; nous sommes donc sûrs que les puissances de la matrice A 4 
supérieures à la ;i lème sont nulles; désignons par l le plus petit entier 
(inférieur ou égal à n) tel que A\ — o, et considérons les matrices non 
nulles : 

Ai, AJ, A 

Soient les multiplicités : 

E 4 définie par les vecteurs X satisfaisant à X = o, 

E 2 définie par ceux satisfaisant à A* _2 X = o, 

E : , définie par ceux satisfaisant à A*7 :j X = o, 
et ainsi de suite jusque E/_ 4 définie par ceux satisfaisant à A 4 X = o. 

Puisque A* = 0 , nous pouvons dire que E 0 = E est définie par les 
vecteurs X satisfaisant à Aj X = o. 

Il est clair que chacune de ces multiplicités est contenue dans celles 
qui la précèdent , autrement dit que 

E = Eo > Ei > E* > . . . > E/_t > o, 


car un vecteur de E t satisfait «à 

A^X = o, 

donc à 

Aj- f+< X = o 

et par conséquent appartient à E/_ 4 . Enfin il est manifeste que E/_ 4 
n’est pas vide, puisque définie par les vecteurs X satisfaisant à A 4 X = o 
avec une matrice A 4 dégénérée. Il est non moins évident que A 4 E; appar- 
tient à E i+i car 

A{“*X = o 

entraîne 

A /-(i+n(AiX) = o. 

Désignons par r 0 le nombre de dimensions de E 0 relativement à E 4 , 
c’est-à-dire le nombre maximum de vecteurs de E 0 linéairement indé- 
pendants (module E 4 ) (*); c’est, si l’on veut, le nombre de dimensions 
de la projection de E 0 parallèlement à E 4 . Nous désignerons de même 
par r 4 le nombre de dimensions de E 4 relativement à E 2 , par r 2 le 


(‘) C’est-à-dire linéairement indépendants entre eux et des vecteurs définissant E,; 
c’est-à-dire aussi tels que . .-f- Xj(X t de E,) entraîne tous les \ nuis. 
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nombre de dimensions de E 2 relativement à E a et ainsi de suite jusqu’à /v_* 
qui est le nombre de dimensions de Ej_* par rapport à zéro, c’est-à-dire 
tout simplement le nombre de dimensions de . 

Nous avons évidemment (Chap. I, § II, n° 8) 

n — n t, 

n\ étant le nombre de dimensions de E| ; de même 

Il 1 = /* 1 -H Hîi 


Donc 


ni-i= r/_t. 


/•n-h f’i H-. . .-h r/_ i == fl. 


D’autre part, E, défini par tous les vecteurs X satisfaisant à A, -1 X — o, 
ne contient pas tout E, sans quoi nous aurions A* -1 = o et l ne serait pas 
l’entier minimum annulant A*, ; donc r 0 >i. Nous allons montrer mainte- 
nant que la suite 

'*o, f '\ > r.>, • • . > t'i— i 

est non décroissante. Prenons dans E 0 , r 0 vecteurs X ( 0 n , X ( 0 2) , . . . , X ( 0 ' v , 
linéairement indépendants (module E, ) ( 1 ). Leurs transformés A < X 0 ' : 
sont dans E* (cette propriété a été établie ci-dessus) et sont linéairement 
indépendants (module E 2 ); supposons en effet que nous ayons la 
relation 

Al AiX ( 0 ,] + ...+ X r# A I Xÿv = x„ 

X 2 désignant un vecteur de E 2 ; appliquons la matrice k l ~- aux vecteurs 
des deux membres et nous obtenons 

X 1 A^'XV>- + -...-HX ro Af- , X('V^o 

ou encore 

A^ix l xy'+...+ x ri x^] = 0 , 


ce qui signifie qu’il existe un vecteur X< de E^ tel que 

relation qui entraîne la nullité des coefficients X, les vecteurs X^ ayant 
été choisis linéairement indépendants (module E,). Nous venons d’établir 

n § ;, o- 


(*) Ils sont alors linéairement indépendants (modE A ) carE t < E t . Donc en particulier 
Xj*) ÿé o (mod E*), A^Xÿ) ?£ q pour k < /. 
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Aux A* Xjf* adjoignons = r 4 — r 0 vecleurs de E u tels que les r* 
vecteurs ainsi formés soient linéairement indépendants (module E 2 ). 
Ces j'i vecteurs forment les X ( / } et satisfont donc à la relation 
A j Xt pé o si k < / — 1 . 

Leurs transformés A < X ( / ) sont dansE 2 et sont linéairement indépendants 
(module E 3 ) par la même démonstration que pour la multiplicité précé- 
dente; donc r^r\. 

Aux A 1 X (y ’ ) adjoignons s 2 = /’•_> — r* vecteurs de E 2 , tels que les ;* 2 
vecteurs de E 3 ainsi formés soient linéairement indépendants (module E 3 ) ; 
ces ;* 2 vecteurs forment les X 2 , etc. 

Nous envisageons donc successivement les vecteurs : 

Dans E 0 , r 0 vecteurs X 0 : 

\(l) \!‘ 2 ) \(r 0 ) 

A 0 > A 0 » •*♦5 A o • 

Dans E|, /'* vecteurs X 1 : 

AtXÿ), AiXjj 2) , Ai\^, X'fo+D, XfJ. 

Dans Eo, r 2 vecteurs X 2 : 


\ 2 VH) \2ve2) 
A , A 0 , A , A 0 


AÏXJV, A.X'fr^Dÿ 






Dans vecteurs X/_ i : 

A^Xÿ>, A'-'XJ.», A ^XyrH), 

A(~ 2 X , A(- ; » X«J*»+», . . . , A{~ 3 x^). . . . , X£ij- a+1) , . . . , x<;v »>. 

Les r 0 premiers (série X 0 ) sont linéairement indépendants (module E<); 
Les suivants (série X< ) sont linéairement indépendants (module E 2 ); 
Les /‘ a suivants (série X 2 ) sont linéairement indépendants (module E 3 ); 

Les ri_ { derniers (série X/_*) sont linéairement indépendants entre eux. 

Par conséquent, ces r 0 + r x +. . . -b /*/_, = n vecteurs sont linéairement 
indépendants, car si Pon avait 

'0 r i n - 1 

2 X, X </> +2 Xy x‘/ ! + . . . +2 X* X <« = O , 

1=1 /=! 4=1 


le vecteur 
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appartenant à E* , nous aurions nécessairement X t - = o pour i =t 1 , 2 , . . . , r 0 
et la relation se réduirait à 



)-\ *=1 


Le même raisonnement prouverait alors que X y = o et ainsi de suite. 
La proposition se trouve établie. 

De plus les A, X 0 sont dans E 4 , les X, dans E 2 , ..., les A*X/_* sont 
nuis. 

Nous allons maintenant ranger les vecteurs de ce tableau dans un 
autre ordre : par colonnes. Partons d’un vecteur X 0 et associons-lui sa 
chaîne d’images : A,X 0 , AJX 0 , . .., A^ _1 X 0 ; nous pouvons ainsi 
former s 0 = r 0 chaînes comprenant chacune l vecteurs 7^0 et commen- 
çant dans la multiplicité E 0 . Puis les s { = r A — r<> vecteurs X, qui ne 
sont pas de la forme A*X 0 donnent s A chaînes de / — 1 vecteurs com- 
mençant en E < . Viendront ensuite s 2 = J’ 2 — f'i chaînes de l — .2 vecteurs 
commençant en E 2 . . . . , et enfin si _ 1 = r/_, — r/_ 2 chaînes de un vecteur 
de E/_, . 

Chacune des chaînes ainsi formées reste invariante par A 1 , car 
chaque vecteur de la chaîne se transforme en celui qui le suit, et le 
dernier se transforme en zéro. Par conséquent, chaque chaîne sert de 
base à une multiplicité invariante par A, ; ces multiplicités sont au 
nombre de 

s =S $ 0 -b $1-4 -. . $/- 1 = /'o-b tri — /*o) -b. . .-+- O /-1 — r/_ 2 ) = r/-i. 

L’espace Eest décompose en r/_ ( multiplicités disjointes et le système 
de coordonnées est adapté à cette décomposition. La matrice A, se 
décompose donc en s matrices carrées se succédant le long de la dia- 
gonale principale et qui comprendront : r Q matrices à l lignes et 1 ‘ 
colonnes, r A — r 0 matrices kl — 1 lignes et / — 1 colonnes, ..., — l'i- a 

matrices à un élément. Eu utilisant le fait, déjà maintes fois signalé, que 
les éléments d’une colonne sont les composantes des vecteurs, transformés 
par la matrice, des vecteurs coordonnés, nous obtenons la forme de ces 
matrices partielles : 


0 

0 

0 

0 

... 0 

0 

I 

0 

0 

0 

... 0 

0 

0 

I 

0 

0 

... 0 

q 

0 

0 

I 

« 

... 0 

0 

0 

0 

0 

0 

... 0 

0 

0 

0 

0 

0 

... I 

0 
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chaque vecteur coordonné étant transformé dans le suivant et le dernier 
en zéro. 

Ceci pour la matrice A< ; quant à la matrice À = À 4 -H p, elle se 
décompose en s matrices carrées se succédant le long de la diagonale 
principale; chacune du type suivant : 


H- 

0 

0 

0 . . 

0 

0 

1 

H- 

0 

0 . . 

0 

0 

0 

1 


0 . . 

0 

0 

0 

0 

1 

0 

0 

0 

0 

0 

0 

0 ... 

P 

0 

0 

0 

0 

0 . . . 

1 

;jl 


Il y a r 0 telles matrices à / lignes et / colonnes, r, — 7’ 0 à l^- i lignes 
et / — i colonnes, r> — r, à / — 2 lignes et l — 2 colonnes, ri_ { — r/_ a 
à un élément. 

On désigne par rang de A 4 le nombre de dimensions de A,E, c’est- 
à-dire le nombre de colonnes de la matrice À, linéairement indépen- 
dantes. Or il est évident que les colonnes non identiquement nulles sont 
indépendantes, et puisqu’il y a s colonnes de zéros (une par matrice 
partielle) le rang de A, est n — s = n ;v_ 4 . 

Le nombre /, les nombres r 0 <ri<r 2 <. . .</*/__, tels que 


/•o-+- r 1-+-. . .H- /'/- 1 = n , 

et le nombre p, peuvent prendre toutes les valeurs; et il leur correspond 
chaque fois une matrice réduite de Jordan. Il suffit, en effet, d’écrire 
a priori la matrice qui correspond à ces nombres et de la transformer par 
une matrice S arbitraire non dégénérée; la matrice ainsi formée présente 
comme matrice réduite de Jordan la matrice désirée. 

Deux matrices équivalentes dans le groupe homogène linéaire ont 
même rnatrice réduite de Jordan (et réciproquement), abstraction faite 
toutefois de l’ordre dans lequel se succèdent les matrices À 4 , A 2 ,..., A/,. 

6. Par conséquent les invariants fondamentaux d’une matrice A 
dans le groupe linéaire homogène sont : les invariants numériques p t - 
(racines de l’équation caractéristique) et les invariants de structure : 
ni (ordre de multiplicité des racines pi), /; (donnant le nombre de lignes 
et de colonnes des matrices partielles de Jordan), r [ f (fixant le nombre 
de ces matrices*parlielles). 

La condition nécessaire suffisante pour que deux matrices soient équi- 
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valantes dans le groupe linéaire homogène, est qu’elles aient les mêmes 
invariants fondamentaux . 

Remarquons encore que si À est une matrice réelle et si les pi sont 
réels, la transformation de coordonnées donnant la forme réduite de 
Jordan est réelle et cette forme réduite est réelle. 

7. Nous allons maintenant démontrer le théorème suivant ( 1 ) : 

Pour qu'une matrice A puisse se ramener à une matrice dia- 
gonale par un changement de coordonnées , il faut et il suffit 
que g{ A) = o, en désignant par g(l) = (A — ) . . . Çk — p*) le poly- 

nôme ayant pour racines simples les racines distinctes de V équation 
caractéristique relative à A. g (A) est alors le polynôme minimum 
de A. La réduction de A. réelle, à la forme diagonale, s’accomplit par un 
changement réel de coordonnées si, et seulement si, toutes les pi sont 
réelles. 

Considérons en effet une matrice A équivalente à une matrice diago- 
nale, et son polynôme caractéristique 

/( X ) = ( X — |JL ! )'*| ( X — )"* . . .( X — JJL* )*k ; 

nous avons vu que l’espace se décompose en k sous-espaces disjoints E 1? 
E 2 , . . . , E 4-. Montrons que, dans ce cas particulier , E; peut être défini 
par les vecteurs X,; satisfaisant *à 

(A — n/;X f = o. 

En effet, formons, pour fixer les idées, la matrice réduite équivalente à 



l 1 » — î J- « 






o 

Il 

£ 

1 

< 

II 

< 

o 

jJU — |j.| 



nous vérifions bien que tous les vecteurs de E i (dont les n y premières 
coordonnées seules ne sont pas milles) sont transformés en zéro par cette 
matrice, puisque les n K premières colonnes de celle-ci ne sont formées 
que de zéros. Il est clair que, réciproquement, tout vecteur satisfaisant 
-à (A — |ULi)Xi=o est bien un vecteur de E; car il satisfait a fortiori 


( l ) Voir Sghreier et Sperner, Vorlesungen über Matrizen. 
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à (A — fA;) ni Xi= o. Or un vecteur quelconque X appartient à l’un des 
sous-espaces E|, E 3 . . . . , E /. et par conséquent vérifie la relation 

(A — {Xi )( A — * . ,(A — = o, 


ce qui revient à dire que g(A) = o. 

Réciproquement, supposons cette relation satisfaite; un vecteur X, 
de E, satisfera à la relation 

(A — fx t )Xt = o, 

car, sinon, — (A — /z,)X, serait un vecteur de E, non nul et l’on 
devrait avoir 

(A - {!,)...( \-pOY, =<», 

relation impossible comme nous nous en assurons de proche en 
proche : (A — (jl 2 ) o, ou bien Y, appartiendrait ù E 2 qui par 
hypothèse est disjoint de E, ; donc (A — fx 3 ) Y a = ( A — )(A — p. 2 )X< 

est un vecteur non nul et appartenant à E, et nous continuons. Tout 
vecteur de E; satisfait à (A — ^)Xi=o, c’est-à-dire que la matrice 
induite par A — p; dans la multiplicité E# est nulle, ce qui entraîne 
immédiatement /,• = i et par conséquent r 0 = m. La forme de Jordan est 
alors une forme diagonale, car elle ne comprend plus de sous-matrices 
d’ordre supérieur à i , et le théorème est établi. 

8. Donnons en terminant quelques indications sur les matrices dégé- 
nérées. Le déterminant étant nul, elle admet zéro pour valeur caracté- 
ristique, à l’ordre n {) . 

Une telle matrice a un polynôme caractéristique : 

/( X) = X"o( X — [Zi )«» . . .( X - \L P )V 

L’espace E se décompose en deux sous-espaces invariants : E 0 d’une 
part, E' = E, E 2 H- . . . + E^ d’autre part. Désignons par A 0 la matrice 
induite par A dans le premier sous-espace et par h! la matrice induite 
dans le second sous-espace; A 0 a pour équation caractéristique )/*•— o 
et est dégénérée, tandis que A’ a pour équation caractéristique 

(X — — (X — 

et n’est pas dégénérée. 

Adaptons notre système de coordonnées à cette décomposition de 
l’espace en choisissant les premiers vecteurs coordonnés e K , e 2 , . . ., e„ # 
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dans E 0 elles autres e n o+n e n 1<rf . îy . . . . e n dans E'. La matrice A s’écrit alors 


et son carré 



et d’une façon générale sa puissance k lèmB : 



Le théorème de Hamilton-Cayley nous apprend que A"° = o; désignons 
alors par l^n Q le plus petit entier positif tel que A l 0 = o. La matrice A 1 
transforme donc E 0 en o et transforme E' en lui-même biunivoquement 
puisque la matrice K! 1 n’est pas dégénérée. Nous pouvons encore dire 
que la matrice A 1 transforme V espace E en V espace E'; il en est 
évidemment de même des puissances supérieures à la f ,ème de la matrice A. 
Dans cet espace E', qui est le noyau de E par rapport à la transforma- 
tion A, la transformation A est biunivoque et se réduit à A'. 

Remarquons que si k <1, la matrice Aj n’est pas nulle et par consé- 
quent l’un des vecteurs : A*^, Aje 2 , . . ., Aje„ o , au moins, appartenant 
à E 0 , n’est pas nul; donc 


tandis que 


A * E > E' si k<l, 
A E = E' si m>l. 


Il est d’autre part clair que chacun des sous-espaces E 0 , A 0 E 0 , A;jE (M ..., 
est contenu dans le précédent; de telle sorte que 

Eo > AoEo>- Ajj Eo > . . . > A o” 1 Eo> Aq Eo = o ; 


ce qui donne, en remarquant que AE — A 0 E 0 + A'E', 

E > AE > A 2 E >. . .> A'-*E > A'E = A'+*E = A'+ 2 E = . . . = E'. 

Le noyau E' est donc atteint, à partir de E, après l^n 0 applications de 
la matrice A. 
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9. Remarquons encore une fois que la recherche de la forme réduite 
et des invariants dépend du groupe de transformations dans lequel on 
opère; dans Pétude précédente nous nous sommes placés dans le groupe 
homogène linéaire. Mais, plus loin, nous introduirons une métrique et 
nous nous limiterons au groupe unitaire (c’est-à-dire au groupe des 
transformations conservant les longueurs); ceci nous introduira de nou- 
veaux invariants, mais surtout donnera un sens géométrique intéressant 
aux racines de V équation caractéristique dont l’ensemble forme le 
spectre. L’introduction de la métrique nous permettra de poursuivre 
assez loin l’étude du spectre, mais le groupe unitaire nous conduira pour 
une matrice quelconque à une forme réduite beaucoup moins simple que 
la forme de Jordan. 


IV. — NOTIONS SUR LE SPECTRE. 

1. Spectre. — Nous désignerons sous le nom de spectre l’ensemble 
des valeurs caractéristiques X;, c’est-à-dire l’ensemble des X = X t 
satisfaisant à l’équation caractéristique 

/(X)adét(X — A) = o. 

Il résulte de la façon même dont nous avons trouvé les valeurs carac- 
téristiques que, si X n’est pas égal à une valeur caractéristique, l’équation 

XX = AX 

n’a pour solution que X — o; tandis que si X est égal à une valeur carac- 
téristique, l’équation précédente présente au moins une solution non 
nulle, et dans le cas général elle en présente une infinité formant une 
multiplicité linéaire 6>i = E/!l, ayant un nombre de dimensions r i ._ l 
supérieur ou égal à i, inférieur ou égal à ti*. Ces vecteurs X s’appellent 
solutions caractéristiques ou solutions propres. 

i° 11 est clair que la condition nécessaire et suffisante pour que la 
matrice A soit dégénérée, est que o soit une valeur caractéristique. 

2 ° Supposons qu’il n’en soit pas ainsi. La matrice À présente alors 
une matrice inverse Ar* dont nous allons déterminer le spectre ; X; étant 
une valeur caractéristique de A et Xj une solution caractéristique corres- 
pondante, nous avons 

X*X*=AX*, 

relation que nous pouvons multiplier à gauche par A~‘ : 

A~ l X/Xj = X/, 
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-V 1 X,- = j- X*. 

Nous voyons donc que les inverses des valeurs caraclérisliques de A 
sont valeurs caractéristiques de A~*. La réciproque est évidente : il 

suffit de partir d’une valeur caractéristique py de A - ', — sera valeur 

H j 

caractéristique de A. Nous avons donc établi que les valeurs caracté- 
ristiques de A~‘ sont les inverses des valeurs caractéristiques de A, 
tandis que les solutions caractéristiques correspondantes sont les 
mêmes. 

3° Effectuons, maintenant, un changement de coordonnées défini par 
X = SS; l’opérateur A sera alors représenté par la matrice (Si = S~^ AS. 
La nature géométrique de la question (direction invariante par l’opéra- 
teur) nous montre que les valeurs caractéristiques de (X sont les mêmes 
que celles de \ et que les solutions caractéristiques seront definies par 

S,= S-*Xi. 

Vérifions-le directement ; la relation 

a,— a)E, = o 

définit la valeur caractéristique X/ et la solution caractéristique E/^±o. 
Remarquons que X/ étant une matrice scalaire, 

X/ = S-» X/ S ; 

nous avons donc 

( S -1 X, S — S -1 AS ) H/ = o. 

Soit 

S-RX/— A)SB|= o 

et, S~‘ étant une matrice non dégénérée, 

(Xi— A)SS,= o. 

En posant X/ = SE/, il vient 

(X/— A ) X i = o; 

X 4 est donc une valeur caractéristique de A et Xj— SE/ une solution 
caractéristique. La réciproque se démontre de la même manière et nous 
arrivons au théorème annoncé : la matrice K et la matrice (Si = S“‘ AS 
ont les mêmes valeurs caractéristiques X t -; les vecteurs caractéristiques 
relatifs à ces deux matrices et correspondant à un même X/ se correspon- 
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dent par la relation X = SS, qui exprime simplement le changement do 
coordonnées. Celte dernière propriété nous met en évidence l’invariance 
des v t - par un changement de coordonnées. 

Nous laisserons au lecteur le soin de reprendre cette question, en 
envisageant, non plus un changement de coordonnées, mais une trans- 
formation linéaire régulière de l’espace (autre interprétation fondamen- 
tale des matrices S). 

4° Envisageons maintenant les puissances positives entières de la 
matrice A; nous avons par hypothèse : 

AX;= X,X/. 


Multiplions à gauche par la matrice A : 


soit 


A î X, = Aà ,X i= = h\X h 


A *X,= X?X,. 


Et si nous recommençons encore cette opération un nombre quelconque 
de fois, nous arrivons à 

A «X,= X«X,, 

ce qui nous démontre que : 

Si ki est une valeur caractéristique de la matrice A, et X/ une 
solution propre correspondante , X" est une valeur caractéristique de 
la matrice A'\ et X,: est une solution propre correspondante. Mais la 
réciproque de cette proposition n’est pas toujours vràie. 

Cette proposition permet deux extensions : 

Remarquons que nous l’avons démontrée pour n entier positif et 
pour n ~ — i ; pour n = o elle est encore vraie, et c’est là un cas banal. 

Nous en déduisons que : 

ki étant une valeur caractéristique de A non dégénérée et X; une 
solution propre correspondante, X 7 * sera une valeur caractéristique de A -1 
et X* une solution propre correspondante; (kj { )" = kj" sera une valeur 
caractéristique de (A"‘ )" — A - ", et X/ une solution propre correspon- 
dante. La proposition s’étend donc aux puissances entières négatives de 
la matrice A. 

Considérons l’autre extension : soit P(A) =^ 0 -\-p\ A + • • • A v , 
un polynôme de la matrice A; si nous suppposons 

X,X,= AX,, 

JULIA 
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Xfx,= A*X,; 

il en résulte immédiatement que 

P(X Z )X Z =P(A)X Z ; 

donc, 5/ Xi est une valeur caractéristique de la matrice À et X z une 
solution propre correspondante , P (Xi) est une valeur caractéristique 
de la matrice P (A) et X, une solution propre correspondante . Ici 
non plus nous n’examinerons pas comment les valeurs caractéristiques 
de A et ses solutions propres peuvent se déduire de celles de P (A). 

2 . Résolvante de A. — Si X n’est pas une valeur caractéristique, le 
système d’équations non homogènes représenté symboliquement par 

(X — À)X = Y 

admet une solution unique X, quel que soit Y, et cette solution est 

X = ( X — A )— 1 Y. 

La matrice (X — A)~', fonction de X, s’appelle la résolvante de A et se 
désigne par la notation 

( X — A ) — 1 = ûi\ == |) R z * ( X ) ||. 


D’autres auteurs (Hilbert, Gourant) adoptent des notations analogues 
à celles des équations intégrales; A étant l’analogue du noyau, les p 
critiques sont les inverses des X z caractéristiques, et le système d’équa- 
tions 

( 1 p A ) X = Y . 
ou 

Y = X — jjl AX 

présente, si p n’est pas une valeur critique, une solution unique fournie 
par la relation 

X = (1 — jjl A )— 1 Y 
ou 

X = Y-+- pR^Y 

en posant (1 — pA)“' = 1 -f- pRy, pour exprimer X en Y sous une forme 
symétrique de celle de Y en X. 

C’est R^ que ces auteurs désignent sous le nom de résolvante. Si A est 
le noyau de la transformation 1 — p A, R^ s’appelle le noyau résolvant. 
Ces deux résolvantes se ramènent d’ailleurs l’une à l’autre par une 
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relation très simple; posons en effet X = ^; l’expression 


devient alors 


ou bien 
soit encore 
D’où la relation 


( X — A)X = Y 

(I- A )x = > 

(i — pA)X = jjlX, 
X = jjl(i — n A) -1 Y, 


<&\ Y = [jl C i — - jjlX ) -1 Y te* ( [JL |x î Rj Jt )Y, pour X 
quel que soit le vecteur Y ; nous avons donc 

(71 [i, = [i -H (i. 2 avec X = — • 


P 


Démontrons une relation fonctionnelle importante due à Hilbert. A 
cet effet envisageons deux valeurs 1 ' et X" quelconques, mais non carac- 
téristiques; les deux matrices X' — A et X"-|$A sont permutables comme 
on peut s’en assurer immédiatement ( 1 ). Si deux matrices sont per- 
mutables 

CD ■= Ï)C, 

si de plus elles ne sont pas dégénérées, leurs produits ne le sont pas non 
plus, et nous pouvons prendre l’inverse des deux membres : 

D-i C-‘ = 


ce qui prouve que leurs inverses sont permutables. Par conséquent, les 
matrices dl>- et tfl)» sont permutables; or nous avons 


c’est-à-dire 
et de même 


(X'-A )*x'=i, 
X'tR>/ — i = À <Ki\ 


X” (K K — i = A (Ki". 


Multiplions respectivement ces deux relations par et et retran- 
chons ; il vient 

X'dlv^X" — &k'= X" (Ki" (Ki' — (Ki ' , 


( l ) Cette propriété est valable pour tous les polynômes en A, car P(A)Q(A) = R (A), 
si R est produit des deux polynômes P et Q. 
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soit 




qui est la relation de Hilberl. 


3. Étude de la résolvante. — Étudions la résolvante, 

dix=.i|RiA(X)|| = (A-A)-i. 


D’après sa définition, nous avons 

R*a( A) 


S /*( X) 
/(A) ’ 


en désignant par S;* (À) le complément algébrique de lè/a — a dans le 
déterminant /(A); S** est donc un polynôme en A de degré n — i. En 
posant 

/( x ) = ( x - fx, )«.(x - us)*' . . .(X - 


où jUL,, p 2 , . . ., jj. p , sont des racines distinctes, nous obtenons pour R u f 
une décomposition en fractions simples de la forme 


Ri*( A) = 


1 ik 


22a — }ijY‘ ' 

i A-i 


R,/, est une fonction bolomorphe de A au voisinage d’une valeur A diffé- 
rente d’une valeur caractéristique. Les pj sont donc les seuls points 
singuliers possibles des R,-*; mais certains R,/, peuvent être réguliers en 
certains /xy comme le prouve l’exemple suivant : 

Soit la matrice diagonale 

A =U fi/ S,* ||; 


nous avons 
et 

ou encore 


x — A = Il (A -fi/) 8,* Il 


(A — A )— 1 



) 



et par conséquent pour A = p/, seul le terme R,/ est singulier. 

Mais nous pouvons assurer qu’en un point du spectre A = p, il est 
impossible que tous les R,** soient réguliers; supposons en effet qu’ils le 
soient tous et choisissons alors une suite A^ A 2 , . . A„ ... de points 
n’appartenant pas au spectre et tendant vers la valeurs jx du spectre 
lorsque s augmente indéfiniment. Dans ces conditions, les fonc- 
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tions Ri/ { (X,) existent et nous avons 

(X,— A )-i <Ki s = i, 
soit, sous forme développée, 

n 

iiCk $ )[hàlk—atk] = àjk pour t, k = i, 2 , . . . , n. 

La fonction R^(X) étant supposée régulière en /*, R;/(X,) tend vers R^/x) 
quand s tend vers l’infini et les équations précédentes donnent 

n 

pO[n$/*— «/*] = 

/=t 

La matrice (X — A) présenterait donc pour X •-= pt, valeur du spectre, 
une réciproque ||R,/ l (jji)||, ce qui est impossible. 

Le spectre est donc V ensemble des points singuliers de la matrice 
<K\~ (X — A) -1 , ces singularités étant constituées par des pôles ; ceci 
n’est plus vrai pour les matrices infinies, puisqu’il peut, par exemple, 
exister des spectres continus. 


4. Développement de la résolvante. — Nous avons obtenu ci-dessus 
l’expression 


i— I h— 1 


somme d’un nombre fini de fractions simples. D’après Laurent, chacune 
de ces fractions est développable en série de puissances de absolument 

convergente lorsque le module de X est supérieur à p, maximum des 
modules des pj. En dehors du cercle de rayon p -f- £ (s positif et arbitrai- 
rement petit), nous avons donc le développement suivant absolument et 
uniformément convergent : 




(ni) 

fi 


Dans le cercle | X | < p, une au moins de ces séries doit être divergente, 
car un R;* au moins présente un pôle de module p. Dans le cas parti- 
culier où tous les pj sont nuis, p est nul, mais le point X = o est encore 
un pôle et par conséquent tous les a ( ™ ] doivent être nuis lorsque m sur*- 
passe un certain nombre m 0 . 
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Si 


nous posons 


Al"*) = \\aW H, 


le développement peut s’écrire en abrégé : 




A<"0 

Xm-M 


m = 0 


(convergent pour | X | ]> p), ce qui introduit une série de matrices. Nous 
pouvons en définir la somme de deux façons qui sont manifestement 
équivalentes. 

a. C’est une matrice dont un élément est la somme de la série formée 
par les éléments correspondants des matrices de la série. 

b. On peut effectuer la somme des k premières matrices, faire tendre k 
vers l’infini, puis prendre la limite de la matrice somme. Par ce procédé 
nous devons définir la limite d’une matrice comme étant la matrice dont 
les éléments sont les limites des éléments correspondants des matrices 
variables. 


Précisons la nature des matrices A (w) . A cet effet, revenons à la défi- 
nition de la résolvante : 

( X — A ) *• 

Le premier membre est une série entière en ~ > absolument et unifor- 
mément convergente lorsque | X | > p + £, tandis que le second membre 
est une série en y réduite à i; identifions, il vient successivement : 

A ( o) = i ( terme constant ), 

Af , )-AAt«) = o ^termeeny^) 

* ■ * , 

A( m )— A Aî w_1 ) = o ^terme en y- ^ > 


D’où nous déduisons : 

A(°) = i, 

a, 

AC*)= A 2 , 


A(m) — A m 
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Le développement obtenu peut donc s’écrire : 


<R X =(X- 


*>-= 2 x 


A m 

m+i ’ 


io3 


C’est le développement de Liouvilie-Neumann, convergent lorsque 
| À | > p + £, p désignant le plus grand module du spectre (c’est-à-dire 
convergent hors du plus petit cercle de centre O contenant tout le spectre). 

Il est clair que nous pouvons déduire de cette relation un dévelop- 
pement de la résolvante Rp, de Hilbert : 


^ ~ î ira == H- •+■ Rfj. » 

or 

^*=2 A '"! ira+ ’’ 

m~o 

d’où 

Ra = A h- fJL A 1 fji 2 \ :i -+- . . . -f- JJ i m A" t+ 1 -i- . . . , 

série convergente dans le plus grand cercle laissant le spectre à l’extérieur. 

Le développement de (R\ pouvait être prévu par des opérations 
formelles : 

On a d’abord 



A"' ] i A 

X'« J ~ X "*■ Â3 




La matrice, ainsi définie, satisfait formellement à la relation 

( X — A ) (R\ = i . 

La vérification en est immédiate, ou nous pouvons l’affirmer sans aucun 
calcul en nous appuyant sur le fait qu’un calcul effectué sur des poly- 
nômes d’une variable est encore valable lorsqu’on y remplace cette 
variable par une matrice. Si nous procédons de cette façon, il nous 
suffit donc de prouver la convergence de la série de matrices. Pour faire 
cette démonstration, nous allons utiliser la notion de valeur absolue de 
matrices de Frobenius (*). 


5. Avec Frobenius nous désignerons par valeur absolue de la 


(*) Sitzber. Berlin, 1911. 
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matrice A et nous écrirons | A |^le nombre positif défini par 


|A|*=2l«<*P- 

t,k 


La valeur absolue est donc la trace (Spur) des deux matrices AA* et A*A. 
Cette notion est très importante pour les matrices finies, mais elle esl 
défaillante pour les matrices infinies (excepté celles dites complète- 
ment continues). Elle tire son intérêt de son invariance par les trans- 
formations unitaires : 


donc 

et, par conséquent, 


a = U-iAU avec U- 1 = U*; 
CX* = U* A* U, 


aa* = U -1 AUU* A* u = u-* A A* U ; 


la propriété envisagée devient alors évidente puisque la trace est inva- 
riante dans une transformation linéaire homogène. 

Ceci étant posé nous appellerons distance de deux matrices A et B la 
quantité 

A(A, B ) = | B — A | , 

et nous aurons évidemment 


A( A, B) = A(B, A)^o, 

l’égalité à zéro ne pouvant avoir lieu que si A = B. 

Les valeurs absolues de Frobenius vérifient encore les deux pro- 
priétés fondamentales suivantes : 

a. V inégalité triangulaire , à savoir 


En effet, 


soit 


[ A -4- B I <; I A I -H B |. 

I A -+• B |* = '£ | n ik + b lk |* < I a ‘ k I + I blk I)"- 

i,k l,k 

| A -+- B j* g | A |* -+- | B |* 3^ | a lk | | b lk I ; 

t,k 


et, en utilisant l’inégalité de Cauchy-Schwarz, 

( S | an 1 1 bit I )* S 2 | a ik I 2 2 | bik | 5 . 

nous obtenons 

I A 4- B I A I* -H B |* + 2 I A 1 1 B I = (I A | + | B !)*, 
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ce qui démontre l’inégalité triangulaire. Celle-ci se généralise à une 
somme d’un nombre quelconque de termes, et par passage à la limite 
aux intégrales 

I | r° 

\J A {t)dt\^J \\{t)\dt, 

en définissant l’intégrale d’une matrice (de même qu’une série de 
matrices) soit par l’intégrale des termes, soit par une somme finie et un 
passage à la limite. 


b. U inégalité du produit 


| AB | g | A 1 J.B |, 


qui, en explicitant, s’écrit 


2 2 a,ibn =2 '*2 1 *'* 


Elle se déduit de l’inégalité de Cauchy-Schwarz 




nous sommons en i < 


i,k \ l J \ U J \ lk 


blkY- 


L’inégalité est alors démontrée en remarquant que 


puisque 


s 2 a « 6 «r^( r 2 ' a « 6 «iy* 

i,k l | i,k V / / 

I ^ nu bik I ^ V | au bu- 1. 


6. Revenons maintenant à l’élude de la convergence de la série de 
Liouville-Neumann 


V Am 

X //l+1 * 


D’après la dernière propriété obtenue, nous avons 


| \ m | < | A I™. 
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C’est un résultat classique sur les séries géométriques, que la 
série]? j est convergente lorsque 1 X 1 > | A |. Si nous remarquons 

d’autre part que 

I 1 = I A”* I = I A | m , 


il en résulte que, dans ces conditions, les séries 

Y 

Zà 


convergent quels que soient i et k et par conséquent que la série matri- 
cielle de Liouville-Neumann converge. 

Mais remarquons que ce procédé nous assure seulement de sa conver- 
gence pour 

m>iAj, 

et ne nous indique pas d’une façon précise toute la région de conver- 
gence. En comparant ce résultat et celui obtenu dans le numéro 4, nous 
trouvons que, nécessairement, p est inférieur ou égal à |A|, résultat 
qu’il est très facile de vérifier directement en revenant à la définition 
de | A | : 

( A | 2 = trace normale de A = trace de AA* = trace de À* A. 

D’autre part, nous avons montré que | A | est invariant par une transfor- 
mation unitaire . Nous allons profiter de cette latitude pour donner à A 
une forme particulièrement simple. Nous verrons plus loin que nous 
pouvons, par une transformation unitaire , ramener A à la forme de 
Schur : 



Xi O 

. . O O 


. . X 2 . 

. O O 

A = 


. . X„_, O 



X„ 


les termes situés au-dessus de la diagonale principale étant tous nuis, et 
les termes de la diagonale principale étant égaux aux valeurs caractéris- 
tiques; il est clair alors que 

n 

| A | â = trace de AA* =2 ^ * 

/~i 

Cette relation entraîne 

I A| *£p* f 

si p désigne les X, maximum; c’est ce que nous voulions établir. 
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l&J 

7. Donnons, de la convergence de la série de Neumann, une autre 
démonstration qui aura sur la précédente l’avantage de s’étendre aux 
matrices infinies dans des cas plus généraux. Envisageons dans la 
matrice A m la somme des valeurs absolues des éléments de chaque 
ligne 

* 

et désignons par M un nombre supérieur à tous les ô{ ,} quel que soit «; 
nous allons prouver par récurrence que 


Q(m) < M®, d'où résultera 1 a\ n k l) | < M" 1 . 



Si nous supposons que la proposition est vraie jusque m — i , 

O;'" 1 <2 I ’ I M < MM*-' = M"', 

/ 


nous démontrons qu’elle est encore vraie pour m . Or elle est vraie 
pour m = i , elle l’est donc pour toutes les valeurs de m. 

En remarquant que 

M'« 


«SP 

Im-hl 


< 


1*1 


nous voyons immédiatement que la série de Neumann est convergente 
pour | X | > M, la série relative à chaque élément se trouvant, dans ces 
conditions, majorée par une série géométrique convergente. 

Cette méthode a subi diverses modifications; en particulier, pour le 
cas où 

k 


quel que soit i, ce qui permet l’application aux matrices infinies 
bornées. 



io8 


CHAPITRE II. 


8. Application de ces évaluations. — Séries entières de matrices . 
— Nous avons montré que R ,:*(X) était défini par la série conver- 

genle ~~ lorsque | X | > p, p étant la borne supérieure du spectre. 


Donc l’expression — 


\aST I 


tend vers zéro lorsque m augmente indéfi- 


( p -h £ ) m M 

niment si e est un nombre positif quelconque. Par conséquent, il est 
possible d’associer à e un nombre fixe a(e) tel que 




quel que soit m. D’autre part, considérons une série entière 

oo 

g(z)='2 i OP zl ‘, 

0 


ayant R pour rayon de convergence, et formons 

m 

gm(^)='^g P Ap. 

0 

m 

C’est une matrice dont l’élément général est^£> a 2t ) « Pour que g m ( A) 

0 

ait une limite lorsque m augmente indéfiniment, il faut et il suffit (par 
définition même) que les séries 

2 £>«!£’ 


soient convergentes quels que soient i et k . Or, d’après ce que nous 
venons de voir, ces séries sont majorées par 

i gp i (p ■+■ c y ,+ ' = «(«Kp -+■ o 2 \8p i( p • + " £ V'> 

0 0 

convergente si p + s < R, c’est-à-dire si p < R, ou bien encore : si le 
cercle de convergence de la série entière contient le spectre à son 
intérieur . 

En résumé, la sèrie^g m A rn converge absolument et définit la 
0 

matrice g( A) si le cercle de convergence de la série entière ^ g m z m 
contient à son intérieur le spectre de la matrice À. 
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En particulier, cela nous permet de définir 


VI (— 

COS A = •> , : 1 

jLà (2/n)! 
o 

. . v (— i) m A îm4t 

sin A = 7 , — — -r- > 

ÂmÀ (2/n-f-i)! 

0 

ces séries étant toujours absolument convergentes. Les théorèmes clas- 
siques d’addition et de multiplication des fonctions exponentielles et 
circulaires sont encore vrais ici si l’on considère des matrices permu- 
tables ; car les calculs les vérifiant à l’aide des séries sont formellement 
les mêmes, que l’on opère sur des variables ordinaires ou sur des 
matrices permutables. Par exemple, si A et R sont permutables, nous 


Cas particulier : 


g\ l qSI’ 


A utre application : Résolution du système différentiel 


aikXk pour I = i, 2, . . n. 


Nous pouvons poser le problème sous forme vectorielle 

d\ _ AY 
dt AX ’ 

X étant le vecteur ( x K , # 2 , .... x n ) avec les conditions initiales X (o) = X 0 . 
Et nous allons montrer que la solution est 

X(O = c A/ X 0 . 

En effet, X(t) s’obtient à partir de X 0 par une matrice dépendant du 
temps : 

X(t) = B(f) X 0 , 

puisque l’équation différentielle proposée est linéaire en X. Supposons 
que la matrice B(£) se développe en série entière de la variable t : 
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les A m étant des matrices d’ordre n. En reportant dans l’équation diffé- 
rentielle et identifiant, il vient 

Ao = i, 

Ai = AAoj 
A s = AÀj, 


A m — AA, n _i, 


soit A m = A m ; la solution cherchée est donc 


a (*.<=2 


A /u t m 


série toujours convergente et Ton a bien 

XU)=Xo<5 A# (1). 


V. - FORME BILINÉAIRE ASSOCIÉE A UNE MATRICE. 


1. Étant donnée une matrice A = J| «,■* ||, nous lui ferons correspondre 
la forme bilinéaire 

n n 

2 atkXtyk, 

l — \ k = 1 

qu’avec Hilbert nous désignerons par A(X, Y), X étant le vecteur de 
coordonnées et Y celui de coordonnées y*. Signalons en passant que 
d’autres auteurs, Wintner en particulier, utilisent, pour désigner la 
forme bilinéaire, la notation ^(A; X, Y). 

Remarquons qu’à une matrice correspond une forme bilinéaire et 
que, réciproquement, à une forme bilinéaire correspond une matrice et 
une seule. 

En langage matriciel, ^ ciikjk est un vecteur qui se note AY, et la 

k 

forme bilinéaire 

A(X, Y) — X'AY, 


X' étant une matrice à une ligne, transposée de la matrice X à une 
colonne. 


(*) Pour cPautres applications, voir Weyl, Quantentheorie, Cliap. I, § 6. 
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II 


En particulier, à la matrice unité correspond la forme bilinéaire 
unité 

n 

K(X, \>X'ï=^i, r , 

i- -\ 

Considérons la relation 
(0 Y = AX; 

si nous désignons par U un vecteur indéterminé , cette relation est 
équivalente à 

U'Y = U'ÀX, 

soit, avec la notation des formes bilinéaires, 

( 2 ) E(U, Y)=A(U, X). 

Il est équivalent de dire que les deux vecteurs X et Y vérifient la 
relation (1) ou satisfont identiquement en U à la relation (2). Ce résul- 
tat peut aussi s’obtenir en parlant formes et équations sans utiliser les 
vecteurs : 

(1) se trouve alors remplacé par le système 


n 

P our * = 

A = t 

qui est équivalent à V identité en u suivante : 


n n 

2 u *y i = 2 atkUiXk > 

i=\ i,k = 1 

qui n’est autre que le développement de la relation (2). 

Nous appellerons produit symbolique (allemand : Faltung)C(U, X) 
des deux formes bilinéaires A(U, X) et B(U, X) et nous noterons 


ou plutôt 

la forme bilinéaire 


C(U, X) = A(U, X) B (U, X), 
G(U, X) = A(U, #)B(#,X), 


2 C ik u i x h 
i,k = l 


eut =2 ctijbjk. 
/ = 1 


avec 
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En d’autres termes, le produit symbolique est la forme bilinéaire 
associée à la matrice produit des matrices A et B; nous pouvons donner 
à ce produit symbolique une forme intéressante : 


or. nous avons 


et de même 


:(u,x) = Ç2 a ij bjk U [Xk — ?[? bjkXk ][? «*/«/ j ; 

V <*A(U, X) 

2è at > ut = —sr / — 

1 = 1 

i 


k = \ 


D’où l’expression cherchée 

n 


C(U,X) = 2 

/=! 


ôxj àuj 


Nous pouvons encore vérifier ce résultat de la façon suivante : 
<)X 

- — est Ja y ième composante du vecteur A' U, 

U JC j 

est la j ièmc composante du vecteur BX, 


et par conséquent 


2 


OX dB 
àxj àuj 


= ( A'U)' BX = U'ABX, 


qui est bien la forme bilinéaire associée à la matrice C = AB. 

Ayant défini le produit de deux formes bilinéaires, nous avons défini 
le carré d’une forme; nous en déduisons le cube, et ainsi de suite jusqu’à 
la 7i ,èmc puissance que nous appellerons ra ,èrmî itérée de A( U, X), et que 
nous noterons A" (U, X). Ce n’est autre que la forme bilinéaire associée 
à A". 

De même, nous définirons la forme réciproque d’une forme bilinéaire 
associée à une matrice A non dégénérée, la forme associée à la matrice 
réciproque A“*. En désignant par A;* le complément algébrique de 
dans le déterminant A de la matrice A, nous avons montré que 
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La forme réciproque s’écrit donc : 


1 1 3 



O 

U\ 

U> 

... Un 


0C\ 

a h 

«12 

... U \n 

A-(U, X)=^W = 


a-i\ 

a -ii 

. . . ci. ln 

i,k 






Xn 

a ni 

a ni 

• • • U nti 



Étudions maintenant 1 effet d'un changement de variables sur les 
vecteurs X et Y ; nous avons 

A(X,Y) = X'AY, 

et les changements de variables s’expriment par les deux matrices 
régulières B et G : 

X = BS, 

Y = GH. 

Dans ces conditions 

X'AY = E'B'ACII « S" Cl H = tfUS, II). 

La forme bilinéaire transformée sera donc associée à 6i~ B' AC. 

dont les éléments sont , b g ag ci k ; d’où nous déduisons le déve- 

/V 

loppement de la forme bilinéaire transformée 

2 b i ia i lClk > 

ik j,i 

que nous aurions pu obtenir directement, sans utiliser -les notations 
matricielles. 

2. Nous appellerons spectre de la forme A (U, X) le spectre de la 
matrice A, c’est-à-dire l’ensemble des racines X du déterminant de la 
forme bilinéaire 

XE( U, X) — A(U, X). 

La résolvante de cette forme est <?v A (U, X) qui satisfait à 

[ X E ( U , X)— A(U, X ) | 6l\ ( U , X) = E(U, X). 

Dans la théorie des équations intégrales, on considère, en général, 
comme résolvante une expression un peu différente, que l’on obtient en 

remplaçant X par - • 

Y = ( i — A n ) X = X — AjaX 


JULIA 
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s’écrit, dans le langage des formes bilinéaires, comme étant l’identité 
en U suivante : 

E(U, Y ) = E(U, X) — fxA(U, X). 


Nous résolvons par une formule symétrique de la première 

X = Y -+• (x R(j.Y, 

qui se traduit par l’identité en U 

E(U, X) = E(U, Y)H- f xR [A (U, Y). 


La forme associée à la matrice R^, c’est-à-dire 
R lA (U, Y)= U'R^Y, 


est dite forme résolvante de la forme A(U, X). En comparant les équa- 
tions donnant X et Y, nous obtenons immédiatement 


c’est-à-dire 


ih-îxRji.= (i — jxA)- 1 , 




K- 


Or nous avons démontré que, lorsque p est inférieur à on peut 
développer (i — p A ) -1 par la formule 


(i — n A )- 1 = I -h \x A -h [X 2 A 2 


Il en résulte que, dans ces mêmes conditions, 

R|x = Ah- [xA 2 + ..,+ (x« A /<4 1 -h...; 

les formes correspondant aux puissances de A étant les itérées de la 
forme bilinéaire associée à A, il est clair que nous avons ( 4 ) 

R p/U, Y) = A(U, Y) h- p A 2 (U, Y) -h. . .h- p n A n+1 (U, Y) + ... 

Cette expression est convergente pour p < p ~' . On pose quelquefois 

*X(U,X) = <R(U, X;X) 
et 

R(j.(U, Y ) = R(U, Y; fx). 

Fredholm a donné une expression de R^ qui est valable quel que 


( 1 ) Il est à peine besoin de remarquer que la forme associée à une somme de 
matrices est la somme des formes associées à chaque matrice; le passage à la limite 
{ série) se fait sans aucune difficulté. 
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soit /a. Nous allons esquisser la méthode de Fredholm. La forme bilinéaire 
associée à (i — pA) -1 est 


O Mi M 2 ... M/i 


U'iï — J1 A)” 1 Y = y ± 


(-sir,) 


en désignant par A(p) le déterminant de i — pA. Si, d’autre part, nous 
posons la forme 


O Ml M 2 ... Un 


fi 

A(U,Y;p) = yt 


nous avons 


U'(i — jjl A >— 1 Y 


A( U, Y;p) 


et par conséquent 


Les deux déterminants ainsi considérés sont des polynômes en p de 
degrés n et /i — i que nous pouvons développer 


A(U, Y ; jjl) = Aj (U, Y) - p A 2 (ü, Y) + p* A 3 (ü, Y)— ( — i )«-i p«-i A«(U, Y), 


A( p) = i — p Ai h- p* A 2 — . . . -H- 

-i)« 

P" A, o 


en posant 




O 

«X, 

«X 4 

. . . M/-- 

yt i 

«X t X 

«x t *. 

• • . tfXPi 

Ai(U,Y )=2 

«x 2 x 

j «a,*. 

. . • «*,*i 


a-kik , 

i 

. . . «xp-i 

la sommation étant effectuée pour 

tous les entiers A’! , A* 


n et tels que A , < A\ 2 < . . . < k t ; et de même 



«x,x t 

«xp-, . 

• • «A.Xi 

-2 

«x s x t 

«x a x s . 

• • ■ «* a X; 


«x-p* , 

«Xi A, . 

• • «xp-i 


Et nous obtenons ainsi l'expression de Fredholm de la résolvante. 
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3. Après ces quelques indications nous voyons l’utilisation de Ja 
forme A(X, Y). Une matrice A est un ensemble de ri 1 nombres que l’on 
peut déterminer par n 2 équations obtenues en donnant àX« valeurs et 
à Y n valeurs convenables dans la forme bilinéaire associée A(X, Y). 
Ceci permet de raisonner et de calculer sur la matrice A par l’inter- 
médiaire des valeurs prises par la forme bilinéaire associée. 


VI. — ESPACE DUAL (OU DUALISTIQUE) ASSOCIÉ 
A L’ESPACE VECTORIEL E*. 


1. Nous avons déjà montré qu’une forme linéaire par rapport aux 
coordonnées d’un vecteur X peut être définie comme un nombre L 
attaché à chaque vecteur X, satisfaisant aux deux relations de linéarité 

L(aX) = aL(X), 

ol désignant un nombre quelconque et X un vecteur quelconque, et 
L(Xi-4-X,)= L(X,)-hL(X*), 


X i et X 2 désignant deux vecteurs quelconques. Ces deux propriétés 
caractérisent une forme linéaire 

n 

i - 1 

Effectuons sur le vecteur X un changement de coordonnées, défini par 

X = AÆ; 


la forme L(X) deviendra alors une certaine forme satisfaisant à 

*(*) = L(X), 

soit 


lorsque 


x t 


=2 


i i 


atkXk pour i = i, 2 , 


Nous devons donc avoir 


2 =2 * i aikx>k = 2 ** 2 * kaki ; 

i ik i k 
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ce qui nous monlre que les a’ t sont définis à partir des oli par la relation 



k 


Lorsqu’on effectue un changement de coordonnées sur les x n . il en 
résulte sur les coefficients a, une substitution linéaire contragrèdiente 
(contravariante) à celle qui s’exerce sur les composantes xi des vecteurs 
de l’espace E n . Nous dirons que les a* définissent un vecteur E dans 
Y espace dualistique & n associé à l’espace vectoriel E n . Nous pouvons 
encore dire que les a, sont les coordonnées tangentielles du plan 

L(X) = o. 

Les deux vecteurs E et X, X quelconque dans E n et E quelconque 
dans V espace dual associé & n . sont tels que leur produit intérieur 
est invariant par un changement de coordonnées , puisque 


E'X = £1 Xi -f- £*#2 -4- • • . -4- 

en désignant dorénavant par £,• les composantes du vecteur E. 

Nous avons déjà remarqué qu’un changement de coordonnées dans les 
espaces E rt et & n s’exprime par des substitutions contra grèdientes ; 
vérilions-le sous forme vectorielle 


x = \æ, 


les matrices A et (fl devant être régulières et telles que 

E / X = Ç'«, 

soit 

çeL'\x = ?æ, 

quels que soient \ et âC. Ce qui entraîne la condition 

a'A = i, 

a =(A-iy=(A"r 1 > 


soit 


qui exprime la contragrédience des deux substitutions. 

Dans le cas particulier où les deux vecteurs X et S satisfont à la rela- 
tion E'X = o, ils sont dits en involution. L’ensemble des vecteurs E en 
involution avec un vecteur X forme un plan dans l’espace dual & n . Nous 
pouvons donc affirmer qu’un vecteur de E n détermine un plan de & n et 
réciproquement. 
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2. Étant donnée une matrice A à n lignes et m colonnes 

A = || aa || avec i = i, 2, , . n; k = 1, 2, . . m, 

nous avons déjà défini sa matrice duale ou transposée à m lignes et 
n colonnes 

A' = || «1a- || avec a' lk = a ki . 

L’introduction de l’espace dual va nous permettre de donner une 
interprétation de la matrice transposée . La matrice A définit une 
transformation ponctuelle permettant de passer d’un espace E m à un 
espace E n par 


xT 

il 

>• 

x = 

Xi 

, Y = 

r» 



X ni 


y n 


soit 

m 

}'i =2 au x k pour 1 = 1,2, . . . , fi. 

k= 1 

Soient 3 m et & n les espaces duals correspondant aux espaces E m 
et E n . De même que X a été choisi arbitrairement dans E m . nous choisi- 
rons arbitrairement II dans & n . Au vecteur Y de E n nous ferons corres- 
pondre le vecteur E de &, n tel que soit invariant le produit intérieur 

H'Y = E'X, 

quel que soit X; ce qui entraîne 

11' A = E', 

ou encore 

E = A' II. 


Nous pouvons donc dire que toute transformation linéaire de E„j 
en E n , soit E, t = AE m (ou Y = AX), laissant invariante la forme 
bilinéaire II' AX formée avec un vecteur H arbitraire de & n et un 
vecteur X arbitraire de Em? induit une transformation linéaire fai- 
sant passer de & a à S m suivant la relation 


E = A'H, 

qui est la transposée de 

Y = AX. 


Nous dirons quelquefois que Kl est l’opérateur dual de A. Remarquons 
que 

II'AX =t E'X = X'E = X'A'II. 
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3. Décomposition de S n corrélative à une décomposition de E„. — 

Si E n est décomposé en deux sous-espaces complémentaires E| 
et E' ayant respectivement comme nombre de dimensions n K et n! 
(avec n — n { 4- n'). nous envisageons dans l’espace S n dual de E n tous 
les vecteurs E qui sont en involution avec tous les vecteurs X du 
sous-espace E,. Il est clair que la condition nécessaire et suffisante 
pour qu’un vecteur S vérifie cette condition est qu’il soit en involulion 
avec les n h vecteurs de base de la multiplicité E 1 ; donc qu’il satisfasse à 

X'^E = o pour / = 1 , 2 , . . . , n\. 

Le vecteur E devant satisfaire à n, équations linéaires, homogènes, 
indépendantes, engendre dans S n une multiplicité à n — n K dimensions 
que nous désignerons par S { . D’après la définition même de celte multi- 
plicité, tout vecteur de E 4 est etr involution avec tout vecteur de & K . 

Si un opérateur A de l’espace E„ laisse invariant le sous-espace E<, 
il en résulte que l’opérateur A’ dual de l’espace S n laisse invariant le 
sous-espace S A . En effet : si X* appartient à E,, le vecteur Y* = AX* 
appartient également à E^. Nous allons montrer que, de même, si H 
appartient à <$, , le vecteur E = A'H appartient également à & K . Le vec- 
teur II appartient à &\ et le vecteur Y 1 appartient à E 1 ; nous avons 
donc 

H'Y, = o. 

Or E' = H' A; par conséquent 

E'Xi = H'AXi = H'Y t =o, 

quel que soit le vecteur X-, de ; par conséquent le vecteur E appar- 
tient à Si . 

Généralisons ce résultat au cas où E se trouve décomposé en un cer- 
tain nombre de sous-espaces complémentaires E,, E 2 , E :} , . . ., ayant 
respectivement pour nombres de dimensions n t , n 2 , n 3 , ... 

E = E, E 2 -h En -4- . . . , 
n — n i h- -4- -h ... . 

Considérons, parmi les vecteurs E de <£, ceux Ei qui sont en involu- 
tion avec tous les vecteurs du sous-espace E 2 -f- E 3 -f- . . . ; d’après 
l’étude précédente, ils engendrent un sous-espace S x à n K dimensions. 
De même, considérons parmi les vecteurs E de S , ceux E 2 qui sont en 
involution avec tous les vecteurs du sous-espace E,+E 3 ils 
engendrent un sous-espace S 2 à n 2 dimensions, et ainsi de suite. 
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Il résulte immédiatement de cette définition que, réciproquement, un 
vecteur quelconque de E* est en involution avec un vecteur quelconque 
de ê 2 + ê 3 + . . . ; un vecteur quelconque de E 2 est en involution avec 
un vecteur quelconque de &\ 4- S A -h • • • t etc. 

Nous allons montrer que dans S les sous-espaces é 2 , S A) • • • 
sont disjoints et complémentaires : 

a. Ils sont disjoints ; à cet effet prouvons que le vecteur 

S, -4- H. - 4 - S 3 


ne peut être nul que si S,, S 2 , E 3 , . . . , le sont. En effet, 
Si = — (S 4 + S 3 +,..) 


appartenant à S\ doit être en involution avec les vecteurs de 
E 2 E 3 + . . . et appartenant à & 2 4 - . . . doit aussi être en invo- 

lution avec tous les vecteurs de E,. Si devant être en involution avec 
tous les vecteurs de E est nécessairement nul; il en est de même des 
autres vecteurs S 2 , E 3 , .... Les sous-espaces ê 2 , ë 3 , ... sont donc 
disjoints. 


6. Ils sont complémentaires , car la somme des dimensions de ces 
espaces disjoints est 


Nous avons donc bien 


n = n\ n t -+- /i 3 -h. . . 


& = S\ H- S-2 -h S 3 -+- . 


Nous pouvons dire en un certain sens que Si est l'espace dual 
de E*, car si X,; appartient à E, et H = H, 4 - H 2 -b H 3 + . . . appar- 
tient à & (H { , H 2 , H 3 . . . . appartenant respectivement à <§,, S 2) S A ...), 
nous avons évidemment 

x;h = x;h„ 

vu que X'- H; est nul lorsque i est différent de y, E; étant dans ces con- 
ditions en involution avec Sj. 

Tout ceci est fort important pour la métrique, où l’involution devien- 
dra l’orthogonalité. 



CHAPITRE III. 

DÉFINITION DK L’ESPACE MÉTRIQUE. PREMIÈRES APPLICATIONS. 
OPÉRATEURS REMARQUABLES DANS L’ESPACE MÉTRIQUE. 


I. - LA MÉTRIQUE DANS L’ESPACE VECTORIEL A n DIMENSIONS. 

1. Nous allons introduire la métrique dans la géométrie linéaire 
homogène par la définition de la longueur |X| d’un vecteur X. Nous 
délerminerons ensuite le groupe de transformations linéaires laissant 
invariante la longueur; nous l’appellerons groupe unitaire el nous dési- 
gnerons par géométrie unitaire la géométrie l’ayant pour groupe fon- 
damental. 

Dans la géométrie euclidienne, la longueur d’un vecteur X, de coor- 
données . . . , nu, est déterminée par la racine carrée de la forme 

quadratique fondamentale dite forme unité : 

| X ! = ^ + ^+ ...+ 4 

Cette expression est invariante lorsqu’on fait un changement de coor- 
données rectangulaires; le groupe de transformations linéaires homogènes 
ainsi défini, qui n’est autre que le groupe des déplacements, est le 
groupe fondamental de la géométrie euclidienne. 

Cette définition de la longueur est intéressante dans le corps des vec- 
teurs X réels; car la condition nécessaire et suffisante pour qu’un 
vecteur réel soit nul est que sa longueur soit nulle. Cette propriété n’est 
plus vraie dans le corps des X complexes, la longueur d’un vecteur 
pouvant être nulle sans que ce vecteur le soit. Alors, nous définirons la 
longueur d’un vecteur X de coordonnées . . . , x ny pcir la forme 

d'Hermite unité 

1X1* = - x t x ± -+-. . ,-h x n x n . 

| X | 2 s’appelle aussi norme de X. 

Nous verrons ci-dessous que cette expression n’est autre que le pro- 
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duit scalaire du vecteur X par lui-même ; remarquons que cette forme 
d’Hermite a toujours une valeur réelle, et que dans le cas d’un vecteur 
réel elle se réduit à la forme classique de la géométrie euclidienne. 
Lorsque, relativement à un système de coordonnées, la longueur aura 
cette forme, nous dirons que le système de coordonnées est normal . 

Nous avons déjà défini (Chap. II, § II, n° 10) le produit intérieur de 
deux vecteurs; parallèlement au changement de définition de la lon- 
gueur d’un vecteur, nous allons modifier cette expression de façon que 
l’on ail comme cas particulier 

1 X I* = ( X, X), 

et la nouvelle expression obtenue s’appellera produit scalaire. Le pro- 
duit scalaire de deux vecteurs X et Y ayant respectivement pour 
coordonnées , x 2l . . . , x n d'une part et y , , y. 2 * . . . ,y n d'autre part , 
est 

( X, Y ) = x'iy , -f- x 2 y-i -t- . . . h- x n y n , 

si nous nous plaçons dans un système de coordonnées normal. 

En notation matricielle on a 

(X, Y) = X'Y = X*Y. 

Le produit scalaire, n’est pas commutatif , car si nous permutons X 
et Y nous obtenons l’expression imaginaire conjuguée 

(Y,X) = (XTY); 

mais il est distributif relativement à la somme des vecteurs 

f-V-4-X', Y) = (X', Y)+.(X", Y), 

et de même 

(X, Y' + Y>(X, Y') + (X, Y'). 

Si l’on multiplie l’un des deux vecteurs par un scalaire a, le produit 
scalaire est multiplié par a ou a suivant que c’est le premier ou le 
second vecteur du produit qui est multiplié par a : 

(«X, Y ) = a( X, Y), 

(X,aY) = «(X, Y); 

et nous en déduisons immédiatement 

(aX, aY) = | a | 4 (X, Y). 

En particulier, soient un vecteur X de coordonnées x n x 2y ...,x n , et e. 
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le t lèmo vecteur coordonné, dont la i lèn,e composante est égale à i et les 
autres sont nulles; nous avons 

x t = (e h X). 

L’espace métrique ainsi défini par l’espace vectoriel et la forme 
d’Hermite unité s’appellera espace unitaire. 


2. Nous allons rechercher les transformations unitaires de coor- 
données, c’est-à-dire les formules de changement de coordonnées qui 
font passer d'un système normal à un autre système normal; la forme 
d’Hermite unité doit être invariante d’après la définition même delà Ion 
gueur d’un vecteur. 

Si nous désignons par 

X = SE 

les formules de transformation de coordonnées, nous devons avoir, quel 
que soit le vecteur X , 

X'X = E'E, puisque (X, X) = X'X, 


c’est-à-dire, quel que soit le vecteur &, 


soit 

et finalement 

qui peut encore s’écrire 


E'S'SE = E' E, 


S' S' S =E', 
S'S = i, 


S*S = I. 


Les changements de coordonnées faisant passer d’un système normal à 
un autre système normal sont obtenus par une matrice S satisfaisant 
à la relation 

S*S = i. 


Et si nous nous reportons aux indications déjà données sur la double 
interprétation des matrices, nous voyons que les transformations du 
groupe unitaire , ou transformations unitaires , sont obtenues aussi 
par une telle matrice S. 

3. Donnons deux propriétés immédiates des matrices unitaires. De 
la relation 


S*S= i, 
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(déterminant de S*) (déterminant de S) — i ; 

or, pour une matrice quelconque, le déterminant de cette matrice et le 
déterminant de la matrice associée sont conjugués; il en résulte que 

| déterminant de S | 2 = i, 

autrement dit une matrice unitaire n’est jamais dégénérée et a un déter- 
minant dont le module est un. 

D’autre part, la relation de définition des matrices unitaires peut 
s’écrire 

S* = S- 1 ; 

et puisque nous savons qu’une matrice ne peut présenter qu’une seule 
inverse, nous voyons que la relation de définition peut encore se mettre 
sous la forme 

SS* = i, 

Dans ce qui précède, on a interprété X = SE comme un changement 
de coordonnées conservant le caractère normal du système de coor- 
données. On peut aussi l’envisager comme une transformation de 
V espace en lui-même (opérateur), définie par la matrice unitaire S et 
conservant les longueurs . Un tel opérateur sera dit opérateur unitaire. 

Montrons que les transformations unitaires forment un groupe. D’une 
part, il est clair que la matrice unité (transformation identique) est uni- 
taire. D’autre part, le produit de deux matrices (ou transformations) 
unitaires est une matrice (ou transformation) unitaire; en effet, par 
hypothèse, 

UU* = i, 

VV* =1; 

formons (UV)(UV)*, il vient 

UVV*U* = U(VV*) U* = UU* = i. 

Nous pouvons donner de ce résultat une démonstration géométrique très 
simple : si deux transformations n’altèrent pas la forme fondamentale 
d’Hermite, leur produit (c’est-à-dire la succession de ces deux transfor- 
mations) ne l’altère pas non plus, et est, par définition même, une 
transformation unitaire. 

Détaillons algébriquement la relation 

U*U = i, 
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définissant les matrices unitaires; désignant toujours par ua P élément 
de la i 1èrao ligne et de la £ ièrae colonne dans la matrice U, il vient 

/~=zn 

^UrtUrk^ $ik pour i et k = i , 2, . . . , n, 

r— 1 


c’est-à-dire un ensemble de n 2 relations, analogues aux relations entre 
les cosinus directeurs d’axes rectangulaires dans la géométrie analytique 
cartésienne. De même que dans ce cas, elles entraînent n 2 autres rela- 
tions qui sont 

r—n 

^^ut r ukr= §ik pour i et k = 1 , 2, . . . , n , 


que l’on obtient immédiatement en détaillant l’égalité 

Utr = i. 

Ces relations peuvent s’interpréter géométriquement. Par la relation 
X = US nous passons d’un système normal de coordonnées à un autre 
système normal; désignons par e,, e 2 , . . . , e n les vecteurs coordonnés 
du premier système et par e \ , e 2 , . . . , e n ceux du second; les quantités 
w 2 t? • . . , u,ù sont les composantes du vecteur <?' dans le premier 
système de coordonnées ; ce système étant normal, la relation 

V U ri Urk = Ô/X- 

JmJ 

r 

n’est que le développement du produit scalaire 

(e'o <?/. )= 

En particulier la longueur des nouveaux vecteurs coordonnés est égale 
à 1 et le produit scalaire de deux vecteurs coordonnés différents est nul; 
nous dirons, par définition, que deux tels vecteurs sont orthogonaux. 
Les n vecteurs e\ d’un système normal quelconque sont donc n vecteurs 
unitaires, deux à deux orthogonaux. 

4. Nous dirons que deux vecteurs X et Y sont orthogonaux si leur 
produit scalaire est nul : 

(X, Y) = o, 

ou, ce qui revient au même, 


(Y,X) = o. 
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Remarquons que n vecteurs unitaires et orthogonaux sont linéaire- 
ment indépendants, car, d’après le paragraphe précèdent, le détermi- 
nant formé à l’aide de leurs composantes n’est pas nul puisqu’il a i pour 
module. 

Démontrons que l’orthogonalité de deux vecteurs est une propriété 
indépendante du système normal de coordonnées choisi, ou, plus géné- 
ralement, que le produit scalaire de deux vecteurs est une grandeur 
intrinsèque liée aux deux vecteurs , c’esl*à-dire indépendante du 
système normal de coordonnées choisi. En effet, la transformation 
X = US respecte la forme fondamentale; par conséquent si nous posons 
Y = UH, et si nous désignons par X une quantité complexe quelconque, 
nous avons 

|X-hXYp = |H-hXH [ 2 , 

puisque 

X-t-XY = U ( E -h X A) ; 

soit, en développant, 

| X X Y j 2 =(X h- X Y, X -t- XY) = (X, X) -T- X( Y, X)-f-X(X, Y)-t-XX(Y, Y), 
et de même 

|E -h XH I 2 = (S -4- XH, S -f- XH) = (S, S) -4- X(H, E)h- X(S, H) -h aX(H, H), 

et, en tenant compte des deux relations 

(X, X) = (S, S), 

(Y, Y) = ( II, H), 

la nouvelle forme de la relation 

X(Y,X)+X(X, Y)=X(II,S)+X(E, H), 

qui doit être vérifiée quel que soit le nombre complexe X; cela 
entraîne 

(X, Y) = (E, H). 

Le produit scalaire de deux vecteurs reste donc bien invariant dans 
un changement unitaire de coordonnées. 

Faisons ici une remarque très simple qui nous sera utile par la suite : 

Si un vecteur A est orthogonal à tous les vecteurs X de E n , il est 
nul; en effet, dans un système normal de coordonnées, nous devons 
avoir, quelles que soient les composantes x n 

n 

= o, 

*=i 
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ce qui entraîne 

ai — o pour i = i, 2, 

5. Considérons l’espace dual & de l’espace unitaire E. Si X est un 
vecteur arbitraire de l’espace E et E un vecteur arbitraire de l’espace 

le produit E'X est invariant dans un changement de coordonnées; or. 
dans l’espace unitaire, X ; X est invariant dans un changement de coor- 
données; le vecteur E — X appartient donc à l’espace dual, c’est-à-dire 
que nous avons 

Ë. 

Nous avons vu que si un opérateur A transforme un espace E m à m 
dimensions en un espace E,, à p dimensions, l’opérateur A' transforme 6> p 
en si nous désignons par & m l’espace dual de E m et par 6> p celui 
de E*. Or ici 

& m = E m , 

= E p . 

L’opérateur A' transforme donc E /; en E m et par conséquent l’opéra- 
teur A' = A* transforme E^ en E m . Il en résulte que l’opérateur AA* 
transforme E p en E m puis E,,, soit finalement E,, en E,,, et que l’opérateur 
A* A transforme E m enE ; , puis E w , soit finalement E m en E m . 

6. Deux figures composées de vecteurs sont égales dans l’espace 
unitaire si elles se déduisent l’une de l’autre par une transformation 
(opérateur) unitaire. La géométrie unitaire est V étude des propriétés 
des figures invariantes dans le groupé unitaire . 

7. Nous allons maintenant décomposer l’espace en espaces orthogo- 
naux complémentaires . 

Considérons, dans l’espace unitaire, un sous-espace E' défini par les 
vecteurs A t , A 2 , . . ., A m linéairement indépendants. Puis considérons 
l’ensemble des vecteurs orthogonaux à tous les A { , c’est-à-dire orthogo- 
naux à tous les vecteurs de E r ; ils forment une multiplicité linéaire E 17 
satisfaisant aux m équations indépendantes suivantes : 

(A,, X) = o, 

; 

( A WJ , X) = o ; 

cette multiplicité E v , dont les vecteurs dépendent de n — m constantes 
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arbitraires, est donc à /i — m dimensions. Nous venons, en résumé, de 
définir deux sous-espaces E' et E" tels qu'un vecteur quelconque de 
l'un est orthogonal à un vecteur quelconque de Vautre; nous dirons 
que ces deux espaces sont orthogonaux. Deux tels sous-espaces ne 
peuvent avoir de vecteur commun non nul , car si tel vecteur existait, 
il devrait être orthogonal à lui-même 

(X, X) = o soit |X| s = o; 

et nous avons déjà remarqué que cette relation entraîne X == o. Les 
sous-espaces E' et E"de l’espace E n ayant un nombre total de dimensions 
égal à m-\-(n — m) = n et n’ayant pas de vecteur commuai, sont 
nécessairement complémentaires 

E = E -f- E". 

Cette décomposition jouit d’une propriété très importante : Si un 
opérateur unitaire A laisse E' invariant il laisse également E" inva- 
riant; car il respecte l’orthogonalité et par conséquent le transformé 
d’un vecteur orthogonal à E' est orthogonal à E', autrement dit il appar- 
tient à E". Donc, dans le domaine des opérateurs unitaires , tout sous- 
espace invariant E' est accompagné univoquement d’un sous-espace 
complémentaire orthogonal E v , lui aussi invariant; E" est une représen- 
tation concrète de l'espace projection de E parallèlement à E'. 

8. Opérateurs hermitiens. — Soit, dans l’espace unitaire, un opérateur 
linéaire représenté par la matrice 

A = \\aik\\. 

Nous avons vu dans l’étude de l’espace dual que le produit S' A Y, dans 
lequel S est un vecteur arbitraire de l’espace & dual de E cl Y un vec- 
teur arbitraire de E, est invariant par un changement de coordonnées. 
Or nous savons que dans l’espace unitaire nous pouvons prendre 

E = X . 

Il en résulte que la forme bilinéaire associée à A, 

X' A Y = ( X, AY) = A(X, Y) , 

est invariante par toute transformation unitaire . 

Un cas fort intéressant pour les matrices est celui où 


A(Y, X) = A (X, Y), 
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ou, ce qui revient au même, 

(Y, AX) = (X, À Y )= (A Y, X), 


quels que soient les vecteurs IL et Y ; nous dirons qu’une telle matrice 
est hermitienne et qu’elle représente un opérateur hermitien. Celle 
condition peut s’écrire 

2 a ik^iyk — 2 âtkytxk, 
l,k i, k 

soit, en changeant le nom des indices au deuxième membre, 

2 oaociyk =2 *ki x iyk' 

i,k t, k 

La condition nécessaire et suffisante pour que cette relation soit vérifiée 
quels que soient x L et yi est que, pour toutes valeurs de i et k nous 
ayons 

«ik = aki , 

c’est-à-dire 

A = A*. 


Nous retrouvons une définition déjà donnée des matrices hermitiennes. 
Mais la définition précédente 

(X, A Y) = ( AX, Y), 


pour tout couple X, Y nous sera aussi très utile dans la suite. 

Dans le cas où Y = X, la relation fondamentale devient 

A (X, X ) = A ( X , X ), 

ce qui revient à dire que la forme 

A(X, X) = S aaXiXk 

est toujours réelle quels que soient les xi. C’est la forme d ) Hermite 
associée à V opérateur hermitien A; ces formes, introduites en algèbre 
et en arithmétique par Hermite, furent étudiées par Hermite, Jordan, 
Poincaré et M. Picard. Nous dirons qu’un'e forme d’Hermite est définie 
positive si elle prend une valeur positive pour tout vecteur X non nul; 
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il résulte de la définition même qu’une forme définie positive ne peut 
correspondre à une matrice dégénérée , car, sinon, 

A(X, X) = X*AX 

s’annulerait pour des vecteurs X non nuis, puisqu’il en serait ainsi de AX. 
En particulier la forme d } Hermite unité associée à V opèra- 

i 

teur unité (qui est un opérateur hermitien) est définie positive. 

La forme d’Hermite unité définit la longueur d’un vecteur rapporté à 
un système normal de coordonnées; si nous avons, au contraire, un sys- 
tème quelconque de coordonnées défini par les vecteurs A*, A 2 , . . . , A n 
linéairément indépendants, l’expression de la longueur d’un vecteur sera 
moins simple. Soit X un vecteur quelconque 

X = #iA l -4- x n X n . 

Et alors 


I X I 2 = (X, X) = (x\ Ai H-. . .- 4 - x n A n , x\ Ai -4-. g. h- x n A „) = 'LgikXtXk, 


en posant 

gik = (Xi, Xk). 

La forme bilinéaire^^;*#;#* est une forme d’Hermite, car nous avons 

t,k 

la relation gu — g h] d’autre part, définissant le carré de la longueur 
d’un*vecteur, elle sera définie positive é 
Nous allons montrer que, réciproquement , une forme d’Hermite 
définie positive , quelconque, peut être considérée comme définissant 
la longueur des vecteurs dans un système de coordonnées convena- 
blement choisi . Soit en effet 

G(X, X)=^gi k F i x k 

i,k 

une forme d’Hermite définie positive et la forme bilinéaire associée 


G(X, Y) **% *•**•?* 

t,k 

nous allons construire un système normal de coordonnées défini par les 
vecteurs e 4 , e 3 , ... , e n , tel que dans ce nouveau système nous ayons 

n 

G(X, X) = £*£/ pour X = £1 ei -4- Ç* -4- . . . -b Ç n e n , 
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soit encore 

G[ÇiCi -+• Xie t -h. . Ç n e n , -+- îie t + . . • •+■ tn^n] = 

Or, d’après sa définition, G(X, Y) est linéaire par rapport à X et par 
rapport à Y, c’est-à-dire que 

G(X'-+-X', Y) = G(X', Y) -h G(X*, Y) 

et de même 

G(X, Y'-hY')=G(X, Y')- 4 -G(X, Y*), 

et 

G (aX, Y) = SG(X, Y) 

et de même 

G (X, a Y) = aG(X, Y). 

La relation envisagée peut donc s’écrire 

i,k 

Elle sera satisfaite pour tous les vecteurs X, sous la condition 

G(gf, e/t) = hk pour é, k = i, 2, . . . , n. 

Montrons que nous pouvons construire le système de vecteurs e if 
e 2 , satisfaisant à ces conditions : 

Choisissons arbitrairement un vecteur g, non nul; en le multipliant 
par un nombre réel nous pourrons en déduire un vecteur e t satisfaisant 
à G(ci , et ) = i puisque G(g<, s* ) > o. 

Ceci étant, considérons l’équation G(e t , X) = o; si n est supérieur 
à i , elle admet certainement une solution non nulle au moins; soit e 2 une 
telle solution; de même que pour e i , nous pouvons trouver un nombre 
réel qui, multipliant s 2 , donne un vecteur e 2 satisfaisant à G(e 2 , e 2 ) = i. 
Nous aurons finalement 

G(e h ek) = §ik pour i t k = 1,2. 

e 2 est indépendant de e K car G(e 4 , e h ) = 1 et G(e,, e 2 ) = o. 

Si n est supérieur à 2, le système de deux équations linéaires (indé- 
pendantes puisque e, et e 2 le sont) 

G(ci, X) = o, 

G(<? 2 , X) == o 

admet au moins une solution; soit g 3 une telle solution; nous pouvons 
trouver un nombre réel qui, multipliant e 3 , donne un vecteur satisfai- 
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sant à G(e 2 , e 3 ) = i . Nous aurons finalement 

G (e t , e/c) = 8/* pour /, À = i, 2 , 3. 

Et nous pouvons continuer. 

Lorsque nous aurons obtenu m<iîivecteurs indépendants e K , o *, . . . , e m 
satisfaisant à 

G(e h ek) = $ik pour /, k = i, 2, . .., w, 

nous envisagerons le système suivant de m équations linéaires (indépen- 
dants comme les e* , . . . , e m ) : 

G(e t , X) = o pour 1 = 1,2,...,;»; 

il admet au moins une solution non nulle; soit e m+1 une telle solution; 
nous pouvons alors trouver un nombre réel qui, multipliant 
donne un vecteur satisfaisant à G(e, n+ i, = L’ensemble 

de w+i vecteurs ainsi formés satisfera à 

G(e„ et) — S//. pour /, Â = 1, 2, . . . , m, m -h 1. 

Nous obtiendrons finalement n vecteurs e t9 e 2 , . . . , e n satisfaisant au \ 
conditions requises. Mais il faut nous assurer qu’ils peuvent être pris 
comme vecteurs coordonnés, c’est-à-dire; qu’ils sont linéairement indé- 
pendants. Soit à démontrer que la relation 

Xi £| - 4 - a.> e* -h . . . - 4 - X /t en — o 

ne peut être satisfaite que si tous les X sont nuis; en effet nous aurions 
G[Xi«t -h Àj e* -+- . . . X,j , a 1 r i -4- X.> <?•> -4- . . . -+* X /t en ] = 0 , 
soit, en développant, 

2 X/XjtG(e/, et) = 0, 

i,k 

et, en tenant compte des relations liant les e,-, 

n 

/-1 

ou 

ï|Xf|* = o, 

qui exige la nullité de tous les X;. 

L’ensemble des a définit donc un système de coordonnées ; nous pou- 
vons dire que ce système de coordonnées est normal et que la forme 
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d'Hermite G(X, X) définit la longueur du vecteur X. Cette réci- 
proque à des applications intéressantes. 

. i° Nous avons, dans ce qui précédé, introduit la métrique par une 
expression analytique de la longueur du vecteur, en fonction des coin» 
posantes de ce vecteur dans un système normal de coordonnées. 

Axiomatiquement , on développe directement une métrique de 
l'espace affine lorsqu’on stipule que : 

A tout vecteur X on fait correspondre un nombre réel représenté par 
|X| 2 = (X, X), que l’on appelle carré de sa longueur, et qui est une 
forme d'Hermite définie positive du vecteur X. 

Il est clair que celte façon de procéder est entièrement équivalente à 
celle employée au début de ce chapitre, puisque nous venons de voir 
qu’il est toujours possible de se ramener à un système normal de coor- 
données. 

2 ° Le procédé précédent a une autre application très importante : il 
permet d 3 adapter un système normal de coordonnées à une décom- 
position de l'espace; soit en effet E f un sous-espace à m dimensions de 
l’espace E à n dimensions. 

Nous venons de démontrer qu’il est toujours possible de choisir 
dans E', m vecteurs normaux linéairement indépendants et deux à deux 
orthogonaux; poursuivant la méthode dans l’espace E, nous associerons 
à ces m vecteurs, n — m autres vecteurs orthonormaux (*). L’ensemble 
des vecteurs e K , e 2 , . . ., e n détermine pour E un système normal de coor- 
données adapté à la décomposition de E en deux sous-espaces E' et E" ; 
l’ensemble des vecteurs e K , e 2î •••? détermine pour E' un système 
normal de coordonnées tandis que l’ensemble des vecteurs e m+i , 
e m+2 > . . e n détermine pour E" un système normal de coordonnées. 
Ces deux sous-espaces sont tels, par leur définition, qu’un vecteur 
quelconque de l’un est orthogonal à un vecteur quelconque de l’autre; 
nous dirons qu’ils sont orthogonaux . 

9. Cherchons si les opérateurs hermitiens forment un groupe; il fau- 
drait pour cela que, si A et B sont hermitiens, leur* produit AB le soit, 
c’est-à-dire que 

BA = ( AB)* = B* A*, 


( l ) Un système de vecteurs orthonormaux est formé de vecteurs normaux (lon- 
gueur unité), deux à deux orthogonaux. 
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soit, en tenant compte des hypothèses A = A% B = B*, 

AB = BA. 


Par conséquent, le produit de deux opérateurs hermitiens n' est hermi- 
tien que si ces deux opérateurs sont permutables . Les opérateurs her- 
mitiens ne forment pas un groupe. 

Les éléments d'une matrice hermitienne, situés dans la diagonale 
principale sont réels ; il en est donc de même de leur somme qui est la 
trace de la matrice. 

Considérons un opérateur quelconque A; nous lui associerons les 
deux opérateurs AA* et A* A que nous appellerons ses normes hermi- 
tiennes; ces deux opérateurs sont, en effet, hermitiens 


(AA*)* = A** A* = AA*, 

et de même 

(A* A)* •— A* A** = A* A. 

Ces fieux matrices hermitiennes ont même trace ( * | aju | 2 > que nous 

i,k 

appellerons carré de la valeur absolue de la matrice A. 

Pour terminer, signalons deux relations très importantes. : 


aa*(x, x) =2 

n I zi î 

AA*(X,X)=2 

n 

A*A(X,X)=2 


c'est-à-dire 


et de même 


i - 1 


10. Tout vecteur X non nul détermine un rayon , en désignant ainsi 
l’ensemble des vecteurs XX, où X est un nombre complexe arbitraire. Les 
vecteurs normés du rayon correspondent à une valeur de X satisfaisant à 


c’est-à-dire 


IM- 1X1 = 1, 



P) Voir au Chapitre précédent la méthode de Frobeaius pour la métrisation de 
Tespace des matrices. 
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nous voyons que 1 n’est déterminé qu’en module ; en particulier, nous 
dirons que le vecteur est le vecteur normé porté par X; l’ensemble 
des vecteurs normés du rayon «st donné par la formule 



où d désigne un angle réel arbitraire. 

Toute transformation A de l’espace, à déterminant non nul, est aussi 
une transformation du corps des rayons; mais, dans le corps des rayons , 
les deux transformations À et X A (où 1 désigne un nombre complexe 
arbitraire, non nul) ont le même effet. Toute transformation A qu’on 
peut, après multiplication par un scalaire, ramener à une transformation 
unitaire, sera dite une rotation dans le corps des rayons. Deux transfor- 
mations unitaires S et S', telles que 

S'= sS, 

e désignant un nombre complexe arbitraire de module i, sont des rota- 
tions identiques dans le corps des rayons. 

II. — QUELQUES APPLICATIONS IMMÉDIATES ET UTILES 
DE CES NOTIONS DE MÉTRIQUE. 

1. Inégalité de Cauchy-Schwarz. — Si X et Y sont deux vecteurs 
quelconques, leur produit scalaire et leurs modules satisfont à l’inégalité 

|(X, Y)|^|X|.|Y|. 

Pour simplifier la démonstration, nous allons nous placer dans un 
système de coordonnées normales; désignons par .r,, # 2 , ..., x n les 
coordonnées de X dans ce système, et par y A , y 2 - . . . , y n celles de Y; 
l’inégalité s’écrit alors 

soit encore 

MI-Hî'H' 

Cette inégalité se déduit immédiatement de la superposition des deux 
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h il r « “î t 

2^' = I ’ 

(=i I L i=« . J 

l-irdj 


La première de ces inégalités exprime simplement que le module d'une 
somme de nombres complexes est inférieur à la somme des modules de 
ces nombres. La seconde est une inégalité très importante due à Cauchy 
et utilisée par Schwarz (qui Ta généralisée en remplaçant les sommes par 
des intégrales) dans l'étude du problème de Dirichlet; sa démonstration 
est immédiate : 


n n n n 

2][ x i x t i -+- ^ i yi i] ! = ) - î 2 1 r- -+- 2 1 1 1 y* i - 1- i yi i !; 

i=i i = i i=i /— i 

or le premier membre ne peut devenir négatif; il en est donc de même 
de la forme quadratique située au second membre; cette forme a donc 
un discriminant négatif ou nul, soit 

WxillyilŸ-WxinWytï-iio, 

qui n'est autre que l'inégalité cherchée. 

Nous ne pourrons avoir 

1 (X, Y)| = | X |.| Y | 

que si les deux inégalités intermédiaires deviennent des égalités; pour la 
seconde, cela exige que la forme quadratique puisse s’annuler, c'est- 
à-dire qu’il existe des valeurs convenables de 1 et ju. telles que 

X]# z | -+- fJL | JK / 1 = O P our t = i, 2 , ..., n; 

ce qui peut s'exprimer de la façon suivante : les rapports — ont un 
module indépendant de V indice i. La première inégalité intermédiaire 
deviendra une égalité à la condition que les quantités xiyt aient toutes 
même argument ou bien encore que les rapports ^ aient un argument 

indépendant de l'indice t. Finalement nous voyons qu’il y aura égalité 
dans le cas , et seulement dans le cas , où 
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c’est-à-dire 

Y = XX, 

X étant un nombre complexe arbitraire. 

Nous pouvons énoncer ce théorème sous la forme suivante : 

Si A est un vecteur quelconque et X un vecteur de longueur i , on 
a toujours 

l( A, X)|<! A |, 

V égalité n y ayant lieu que pour 



relation où Q désigne un angle réel arbitraire . Dans le cas particulier 
où A est nul, l’égalité est satisfaite pour tous les vecteurs X. 

2. Systèmes de vecteurs orthogonaux. Méthode d’orthogonalisation 
de Schmidt. — Un système de vecteurs est dit orthogonal , si les vec- 
teurs qui le composent sont deux à deux orthogonaux. Il est dit ortho- 
gonal et normal, ou plus brièvement orthonormal , si, de plus, les 
vecteurs ont une longueur égale à i; si c t , e 2 , . .., e m désignent les 
vecteurs du système, ces conditions peuvent se résumer par 


( e h et) = 8/*. 


Les vecteurs formant un système orthonormal sont nécessairement 
linéairement indépendants ; montrons en effet que la relation 

Xi e 1 4- X*> e.> 4- . . .4- X m e m = o 

ne peut avoir lieu que si tous les X sont nuis; il suffit, pour cela, de 
multiplier scalairement par <?,• : 

Xi(6j, <?i) 4- Ci) 4-. . .4- li(e h ei) 4-. . .4- X„,(e m , e{) = o; 

ce qui, compte tenu des hypothèses, se réduit à 

X/ = o. 

Un jeu de m vecteurs orthonormaux forme donc un ensemble de 
m vecteurs linéairement indépendants. En particulier, avec un jeu dé 
n vecteurs orthonormaux de l’espace vectoriel à n dimensions, on peut 
exprimer tous les vecteurs de cet espace , car les vecteurs X, e K , e 2 , . en 




CHAPITRE III. 

au nombre de n H- i sont certainement dépendants, soit 


xx •+* Xj 6\ -h . . ■+* y. fi € n ~ o. 

Or X n’est certainement pas nul, puisque les vecteurs e K , e 2 , . . . , e n sont 
indépendants; nous pouvons donc résoudre cette relation par rapport 
â X ï 

X = x\ e\ 4- x-iei H-. . .- 4 - x n e n . 

Les vecteurs e 2 , ..., e n peuvent donc servir de base à VespaceJL u . 
Les nombres Xi sont appelés les composantes du vecteur X par rapport 
au système de coordonnées défini par les vecteurs e\ ; ils ont une expres- 
sion particulièrement simple, obtenue en multipliant scalairement à 
gauche la dernière relation par ei : 

Xi=(e h X). 

Arrivons maintenant au procédé d' orthogonalisation de Schmidt : 

Soient m vecteurs linéairement indépendants k K , A 2 , . . . , A m ( m<n ). 
Ces vecteurs déterminent une multiplicité linéaire; nous pouvons 
trouver dans cette multiplicité m vecteurs orthogonaux et normaux 
(et par conséquent linéairement indépendants), définis par des rela- 
tions de la forme 

Bi = r u Ai, 

B t = /'21 Ai 4- /’ 22 Aî, 

B3 = 7*31 Al -h /\v> Aj-È- r 3 3 A3, 

* J 

B m = r m l A-i -h /•/ ni A* -b r m3 A 3 - 4 - . . . +/',«;« A my 
les rtk étant choisis tels que 

( Bj-B*) == o/* 

et l'nÿéo pour toute valeur de i, de telle sorte qu* inversement A* 
s’exprime en fonction de , A 2 en fonction de B! et de B 2 , A 3 en 
fonction de B* , B a et B 3 , etc . 

Une matrice telle que ||ru||, dont tous les éléments situés au-dessus 
de la diagonale principale sont nuis, ceux de la diagonale principale ne 
l’étant pas, est dite matrice de récurrence ou encore matrice canonique 
non dégénérée (*). 


( l ) La matrice est canonique en ce sens que tous les éléments situés au-dessus de la 
diagonale principale sont nuis; elle e9t non dégénérée, car son déterminant, qui est 
égal à r n r„ .. . r miM , est différent de zéro. 



DÉFINITION PE L'ESPACE MÉTRIQUE. l39 

La détermination des vecteurs orthonormaux sera faite en deux étapes; 
dans la première nous allons former un système de vecteurs orthogonaux, 
dans la seconde nous normerons. 

Première étape . — Cherchons un système de vecteurs orthogonaux 
(3 4 , (3 a , (3 in définis par des relations de la forme 

Pi = Ai, 

Pï = ?2l Pl ■+* Aj, 

?3 = P31 Pl H" P32 P 2 “+“ A 3 , 


P»t — Pmi Pl *+* P mï P 2 -+- pms Ps *+*••• "+* A ni» 

Nous allons déterminer de proche en proche les coefficients p. p 2< sera 
obtenu en écrivant que les vecteurs (3* et (3 a sont orthogonaux 

(Pij P2) = (Ai, A*) - 4 - p*i(Ai, pi) = o; 


et puisque (A* , (3*) = | A, | 2 n’est pas nul, nous obtenons 


et le vecteur |3 2 non nul : 


P21 


(A», A,) 

! Ai p ’ 


h=A t - 


(A,, A,) 
1 Ai r- 


Ai. 


((3 2 ^o, car A t et A a sont indépendants ). Cette formule a une inter- 
prétation géométrique très simple 


On obtient (3 a en retranchant de A a sa composante suivant le 
vecteur A,. 


Fig. 3. 



Nous allons voir que, de même, nous obtiendrons (3 a en retranchant 
de A 3 sa composante dans le plan déterminé par les deux vecteurs A< 
et A a . En effet : 

(3 a doit être orthogonal à (3* et (3 a , ce qui nous conduit aux deux 
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relations : 

(fhj h) = ( Pi» A») P32(?l, Pi) +• P31 I pl I î= °j 

(p2î p3 ) = (Pa, Ag) -+- p 3 î | P î |* -t“p3l(PsPl)= 

soit 

( ?i, Aj) -h P31 I Pi I 1 =S O, 

( Ps» An) 4- p 3 2 1 pi |* = o ; 

les vecteurs (3* et (3 a n’étant pas nuis, nous pouvons tirer p 31 et p 32 de 
ces formules et par suite obtenir le vecteur (3 a . Les trois vecteurs ainsi 
obtenus sont orthogonaux deux à deux; et nous pouvons continuer ainsi 
de proche en proche, aucun des vecteurs j3* n'étant nul , puisque (3 2 est 
une combinaison linéaire à coefficients non tous nuis de A| et A 2 linéai- 
rement indépendants, (3 a est une combinaison linéaire de A 3 , (3 2 et(3 4 , 
c’est-à-dire de A 3 , A 2 et A, linéairement indépendants,' et ainsi de suite. 

Seconde étape . — Nous pouvons alors franchir la seconde étape en 
normant les vecteurs (3 que nous venons de déterminer. Il suffit de 
poser 

H --ËL 

1— i p/f 

Les vecteurs B; sont deux à deux orthogonaux, puisque les (3,: le sont, et 

les coefficients ru — sont bien différents de zéro. 

I Pi I 

Considérons maintenant le cas où les vecteurs donnés A,, A 2 , ..., A,„ 
ne sont pas linéairement indépendants . Supposons donc que les 
p premiers vecteurs A,, A 2 , . . ., A,, soient linéairement indépendants et 
que le vecteur A^ +1 en soit une combinaison linéaire. Le vecteur (3^,, 
que nous obtenons en retranchant du vecteur A /MH sa composante dans 
la multiplicité définie par A,, A 2 , . . ., A p , est nul ; il nous suffira de 
continuer les opérations de Schmidt sans plus nous occuper du vec- 
teur (3 p+{ . Finalement, si nous appliquons brutalement la méthode de 
Schmidt à des vecteurs qui ne sont pas indépendants, nous obtiendrons 
autant de fois un vecteur (3 nul qu'il y a de vecteurs A combinaisons 
linéaires des vecteurs précédents ; autrement dit, il y aura autant de 
vecteurs (3 nuis qu’il y a de relations distinctes entre les vecteurs A. Les 
vecteur^ (3 non nuis pourront alors être normés et servir de base à la 
multiplicité qui a un nombre de dimensions inférieur à m. 

3. Systèmes complets. — Nous dirons qu’un système de vecteurs B< 
orthogonaux est complet , s’il n’existe pas de vecteur X non nul ortho- 
gonal à tous les vecteurs du système, c ? ^st-à-dire vérifiant 

(B/, X) = o pour i = i, 2 , . . ., m. 
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Le système sera dit incomplet s’il existe un vecteur non nul satisfaisant 
à ces équations. 

Si le nombre m des vecteurs orthogonaux est inférieur au nombre de 
dimensions n de Pespace, le système de vecteurs orthogonaux est incom- 
plet, car un système de m équations linéaires homogènes kn inconnues 
avec m <; n présente au moins une solution non nulle. 

Si le nombre de vecteurs orthogonaux est égal au nombre de dimen- 
sions de Pespace, le système est complet, car le système de n équations 
linéaires homogènes à n inconnues n ; a que la solution o, étant donné 
que son déterminant n’est pas nul (les vecteurs B,, formant un système 
orthogonal, sont linéairement indépendants). 

Nous avons donc un critère simple, basé sur le nombre de 
dimensions , qui nous permet de reconnaître si un système de vecteurs 
orthogonaux est complet ou non; mais ce critère ne peut évidemment 
pas s’étendre aux espaces à une infinité de dimensions; nous allons 
donner un autre critère, permettant V extension à une infinité de 
dimensions , et que l’on désigne par Y inégalité de Parseval ou de 
B esse l. 

Soit un système orthogonal et normal de vecteurs e { , e 2 , ..., e m et un 
vecteur X, arbitraire, de E w . Ce vecteur est la somme de deux autres : 
l’un situé dans la multiplicité linéaire définie par le système orthogonal, 
l’autre dans la multiplité complémentaire (si elle existe) 

i 

N = X w - 4 - x± -4- x-> e- 2 . x m e m , 

soit encore 


m 



i=l 


Élevons les deux membres au carré scalaire 



Utilisons maintenant l’hypothèse : le système des e x est orthonormal. 
Donc 

(e h X) = x iy 
(X, ôî ) = x^ 

(et, = 



CHAPITRE III. 


*4* 

Il vient alors 

m m in 

|X m |*=|X|*— 'S^x l æt+'^x{xt\ 

i = l /=l t~\ 

soit 

m 

|x„, l’-ix|*-2***i- 

i + 1 

Par conséquent nous avons toujours , quel que soit. X. 

m 

2^SIX|*. 

fc=l 

l’égalité ayant lieu lorsque X m est nul, et dans ce cas seulement. Or : 

Si le système est complet , le vecteur qui doit être orthogonal 
à e 2 , • • •> «m? est nécessairement nul quel que soit X, par consé- 
quent, pour un vecteur X quelconque , nous avons l’égalité de Pytha- 
gore 

m 

I X| s =^a;iar,. 

Si ie système est incomplet , l'ègalitè ne peut avoir lieu pour tous 
les vecteurs X, car il existe au moins un vecteur non nul X orthogonal 
aux vecteurs e 2 , . . . , e m , donc tel que 

X = X m =^o et X\ — Xo — . . . = x m — o. 

En résumé, pour que le système soit complet , il faut et il suffit 
que , pour tout vecteur X, on ait 

m 

l X l 

fc=i 

Pour un système incomplet, l’égalité précédente n’est réalisée que 


Fig. 4. 



pour un vecteur X situé dans la multiplicité définie par le système 
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lincompiet de vecteurs. Dans le cas du système complet, les vec- 
teurs e,, e m (m = n). déterminent un système de coordonnées 

normales pour l’espace E w . 

Les résultats auxquels nous venons d’aboutir sont évidents dans le cas 
4e la géométrie euclidienne à trois dimensions. 

Trois vecteurs orthogonaux forment un système complet; il n’existe 
pas de vecteur non nul orthogonal à ces trois vecteurs; si x K , x 2 
désignent les projections orthogonales d’un vecteur Xde l’espace sur ces 
trois vecteurs, nous avons 

X 2 = x\ x'% -f- x$ (géométrie réelle) 

et enfin ces trois vecteurs déterminent un système de coordonnées pour 
l’espace 

X = X\C\ -H X 2 6 2 -+■ #3 

Deux vecteurs orthogonaux forment un système incomplet ; il existe 
un vecteur orthogonal à ces deux vecteurs ; si désignent les pro- 

jections orthogonales d’un vecteur X de l’espace sur ces deux vecteurs, 
nous avons 

X 2 ^#f -h x \ , 

l’égalité n’étant réalisée que pour les vecteurs X situés dans le plan 
défini par les vecteurs e K et e 2 ; enfin ces deux vecteurs ne déterminent 
pas un système de coordonnées de l’espace. 

Le critère que nous venons d’obtenir peut revêtir une forme plus 
générale : 

La condition nécessaire et suffisante pour qu'un système ortho- 
normal soit complet est que , quel que soient les vecteurs X et Y, on ait 

m 

( x > y )= 2 ^- 

tel 

La première forme du critère se déduit de celle-ci en faisant X= Y; 
réciproquement cette relation se déduit de la première appliquée au vec- 
teur X + XY, où X désigne un scalaire quelconque : 

m 

|X+xyi*=2i*h-^‘I ! 

tel 

ou 

m 

(X -+* XY, X -h XY) =2 X^/). (#*-+- X/i). 

tel 
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Soit, en développant 

| X |*+ X(X, Y) -h X(Y, X) -t- XX I Y I* X^,+ ïy t *,+ XX/o'J- 

i~\ 


Et en tenant compte des deux relations : 

m 

1=1 

ni 

I Y 

fc=l 

il vient 

m m 

X(X, Y) + X(Y, X) = Xj^i/H- >• 

K=1 1 = 1 


qui doit être vérifiée quel que soit X complexe; il en résu lie 

m 

(X, Y)=2*«Ti. 

fc=l 

et, par suite, 

ni 

(Y,x)=2)ri*i- 

/=) 


Ainsi que nous l’avons déjà signalé, ce critère, sous l’une quelconque 
de ses deux formes, est plus intéressant que le critère de la dimension, 
car il peut se généraliser à un espace à une infinité de dimensions . 


4. Critère de Gram pour que m vecteurs soient linéairement indépen- 
dants. — L’intérêt de ce critère réside en ce qu’il ne fait pas intervenir 
les coordonnées des vecteurs, mais uniquement des éléments invariants 
par transformation unitaire , autrement dit des éléments ayant une 
existence intrinsèque dans la géométrie unitaire; ces éléments seront ici 
des produits scalaires. Le critère de Gram s’énonce delà façon suivante : 

La condition nécessaire et suffisante pour que m vecteurs A* , A 2 , ..., 
A m soient linéairement dépendants est que le déterminant 

• • Ai m 

• • A*,,, 

• • A tn m 
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soit nul , A ik désignant le produit scalaire (A A*). Lorsque les vec- 
teurs A u A a , . . A m sont indépendants, ce déterminant ri est pas 
nul et il est positif. 

Donnons la démons Ira lion de Schmidt (^ ) : 

Si nous effectuons la transformation 

m 

A * = 2 Y/<tG/ '’ 
fc=i 

successivement dans le premier et le deuxième terme de chaque produit 
scalaire figurant dans r, le déterminant de Gram devient successivement 



Ti i 

Yi* • 

• • Yl m 


(Ci, Ai) 

(Ci, A.) . 

. (Ci, A /n ) 

r = 

Y« 


• • 'tim 


(C., A,) 

(C-2, A 2 ) . 

. (C-2, A fu ) 


Y/»i 

T mt • 

• • Y m m 


( G/», Ai i 

(C /l( , A,) 

• • ( C/», A ni ) 


= I Y/*l IyiaIKC* C*)|. 


En particulier, nous pouvons prendre pour C, les vecteurs (3, obtenus 
au n° 2 par la méthode d’orthogonalisation de Schmidt; nous savons que, 
dans ces conditions, 

lYi*l=i 

et 

(C/, C*) = o si i ^ /, 

tandis que (C/, C, ) = ( (3; | 2 ; la relation précédente devient alors 

r = i Pi i 2 .| I*- 

Le déterminant de Gram est donc toujours positif ou nul; la condition 
nécessaire et suffisante pour qu’il soit nul est que Pun des vecteurs (3, 
soit nul, c’est-à-dire que les vecteurs A,, A 2 , ..., A,„ soient linéairement 
indépendants. 

Indiquons une autre démonstration, en admettant quelques résultats 
que nous trouverons dans le paragraphe suivant. Le déterminant T se 
présente dans l’étude de la forme d’Hermite 

G(X, X) = I X\ \ X -h Xi A- 2 -+-. . .-h x n Al | 2 A *)- 

i,k 

Si nous envisageons les systèmes de nombres tels que 2|#;| 2 = r, la 
(‘) Voir Rendi conti del Circolo mathematico di Palermo , tqo8. 


JULIA 


10 
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forme d’Hermite est définie positive ot ne peut s’annuler que si les vec -/ 
teurs donnés sont linéairement dépendants. 

Nous verrons que cela entraîne : 

Dans le cas où les vecteurs donnés sont indépendants, que toutes les 
valeurs du spectre de la matrice ( A;* | sont positives; 

Dans le cas où les vecteurs donnés sont dépendants, que l’une au moins 
des valeurs du spectre est nulle. 

Les valeurs caractéristiques étant données par l’équation 
I A**— X 8a | = o, 

il en résulte, que le déterminant T de la matrice f A^.j est égal au produit 
des valeurs caractéristiques; donc : 

Dans le cas où les vecteurs donnés sont indépendants, T est positif; 
Dans le cas où les vecteurs donnés sont dépendants, T est nul. 

Nous pouvons encore raisonner de la façon suivante : prenons un sys- 
tème normal de coordonnées et désignons par x Xin les 
coordonnées du vecteur A;. Nous aurons alors 


n 

A ik — ^^nXki 


et le déterminant de Gram pourra s’écrire 


r 


l 


'Z\oc i i k Xki k \, 


le dernier signe 1 étant étendu à tous les arrangements possibles de 
m entiers Z* compris entre 1 et n . Le déterminant correspondant est nul 
si deux de ces entiers sont égaux; il en résulte que T est nul si m > n. 
Or, dans ce cas, les m vecteurs sont nécessairement dépendants. 

Il nous reste donc uniquement à examiner le cas m^n. La même 
propriété de décomposition d’un déterminant en une somme de déter- 
minants nous permet aisément de voir que 


S | xn^x kl k | 


#i/x æn l +...-hx J/ Mt 

3V t -+-- • •-+- x 2 i m x i i m 

#2/, -+• . - 

*Vl #2 

■ .H- 

• • H" l m 

Xmli X\ / t -+-. • X, n l m X\l m 

X m I t #2/, -+* . . 

• .-+■ Xnil m X'il^ 


X\l i OC,nl i ' Jr ' ’ 

' Æ\l m ^ m ^m 


Xmh *+- • • 

. -h X%l m &ml m 


■+* • 

. X m l m X m i m 
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le signe l ' étant étendu à toutes les combinaisons possibles des nombres 
entiers l { , / 2 , . . , l m tel que 

Or, au second .membre, nous reconnaissons le produit d’une matrice, 
par la matrice conjuguée; T est donc la somme des carrés des modules 
des déterminants d’ordre m extraits de la matrice 


#11 

#12 • 

* #1 n 

#21 

#22 • 

. X*_ n 

#//l1 

# mi 

• • # m/i 


formée avec les composantes des vecteurs A,, A._>, . . . , A n . Nous retrou- 
vons ainsi le critère de Gram. 

Si les vecteurs sont indépendants, ces déterminants ne sont pas tous 
nuis et le déterminant T est positif; 

Si les vecteurs sont dépendants, ces déterminants sont tous nuis et le 
déterminant T est nul. 


III. — OPÉRATEURS ET MATRICES REMARQUABLES 
DANS L’ESPACE MÉTRIQUE. 

FORMES CANONIQUES DANS LE GROUPE UNITAIRE. 

1. Forme canonique ou réduite de Schur, — Si nous effectuons dans 
l’espace unitaire, un changement d’axes de coordonnées défini par 

X = UE, 

l’opérateur linéaire A qui s’exprimait dans les anciennes coordonnées 
par la matrice A s’exprime dans les nouvelles coordonnées par la 
matrice CJ” 1 AU. Les deux matrices A et U -1 AU sont dites équivalentes 
dans la géométrie unitaire. 

Si nous effectuons sur l’espace unitaire une transformation linéaire 
définie par 

X = UX, 

l’opérateur A est transformé en l’opérateur UAlj -1 . Les deux matrices A 
et U AU”' sont équivalentes dans la géométrie unitaire. 

Deux matrices équivalentes à l’un de ces points de vue, le sont égale- 
ment à l’autre; la recherche d’une forme canonique d’une matrice dans 
la géométrie unitaire, consiste à trouver une matrice unitaire U telle que, 
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par exemple, la matrice U” 1 AU ait la forme la plus simple possible , 
cette matrice U~‘ AU sera alors dite la forme canonique , dans le 
groupe unitaire , de la matrice A. 

Or, de combien de paramètres dépend la matrice unitaire la plus 
générale ? Elle comprend ri 2 éléments liés par n relations de normalisa- 
tion et relations d’orthogonalité; elle dépend donc finalement 

de 

„ n(n—i) n(n — i) 

n- — n — 

?. ‘ï 

paramètres; d’autre part, une matrice d’ordre n comprend — - élé- 

ments situés au-dessus de sa diagonale principale; dans le cas général, 
nous ne pouvons donc espérer guère mieux que d 'annuler les termes 
situés au dessus de la diagonale principale dans la forme canonique . 

Nous allons montrer, de proche en proche, qu’il est possible de trouver 
un système de coordonnées normales (e*, Co, . . ., e n ) tel qu’il en soit 
ainsi; la forme canonique obtenue est appelée forme de Schur. Nous 
envisageons donc V opérateur linéaire A et nous cherchons un système 
normal de coordonnées (e< . . . e n ) tel que, dans ce système, la matrice 
de A soit réduite de Schur . La dernière colonne de la matrice réduite 
de l’opérateur A doit être 

o 

O 

O 

Or, nous savons que les éléments de celle colonne sont les compo- 
santes (dans le système e x . . . £ n ) du vecteur transformé, par l’opérateur A, 
du dernier vecteur coordonné e n ; donc le système normal (e 1 .*.e n ) doit 
être tel que 

A e n — X/i e , t ; 

\ n est donc une valeur caractéristique de V opérateur A; et nous pren- 
drons pour e n une solution caractéristique correspondant à la racine X„. 
Nous avons ainsi déterminé le dernier vecteur coordonné du système 
coordonné par rapport auquel la matrice de A prendra la forme réduite 
de Schur; laissons, pour l’instant, arbitraires les vecteurs e 4 , . . . ,e n -\ 

en les astreignant toutefois à former avec e n fixe un système normal 
provisoire de coordonnées; dans l’un quelconque de ces systèmes pro- 
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visoires la matrice de l’opérateur A aura la forme 



Considérons l’opérateur qui, dans le système provisoire actuel, admet 
la matrice À ( , nous l’appellerons l’opérateur A* ; il opère dans le sous- 
espace défini par les vecteurs e K , e 2 > . . , e, t _, , qui est la projection de E 
parallèlement à <?„; A 4 lie donc les projections, parallèlement à e, t , des 
deux vecteurs X et AX. Nous dirons que A! est V opérateur induit 
par A dans le sous-espace orthogonal à e n . Dans ce sous-espace , nous 
pouvons disposer arbitrairement du système orthogonal de vecteurs 
coordonnés e,, , e n -\ sans rien changer à la dernière colonne de 

la matrice de A; nous allons profiter de cette latitude pour simplifier la 
matrice A,, et, à cet effet, nous allons opérer comme précédemment : 
annuler tous les éléments de la dernière colonne, sauf le dernier. Nous 
serons conduit à la relation 

A i € n — j = X/j—i Cn— 1 , 

d’où nous déduirons que X„_, doit être une valeur caractéristique du 
spectre de A,. Mais nous avons 

dét ( A — X) = ( A/* — X) dét ( Ai — X); 

d’où il résulte immédiatement que les valeurs caractéristiques de A< sont 
les valeurs caractéristiques de A excepté X, t . Nous prenons donc une 
valeur propre du spectre de A autre que X„, soit ; nous pouvons lui 
associer un vecteur tel que, si e u <? 2 , . . ., <?„_ 2 sont des vecteurs 
quelconques formant avec et e n déjà fixé un système normal provi- 
soire de coordonnées, la matrice de l’opérateur V relative à ce second 
système provisoire ait la forme 



Et si nous continuons ainsi de proche en proche, nous arriverons finale- 
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ment à la forme réduite de Schur avec un système de vecteurs coor- 
donnés e n , e K déterminé tel que, dans ce système, la matrice 

de A soit 



y 

0 

0 

0 

0 


. . X* 0 

0 

0 

IM AU = 

.. .. x 3 ... 

0 

0 



X«— 1 

0 

x« 


tous les termes au-dessus de la diagonale principale étant nuis. 

Remarquons que le vecteur e n est invariant en direction par A; mais 
il n’en est pas de même de Le vecteur est invariant par A, ; 
autrement dit la projection de Ae*_, sur Vespace orthogonal à e n 
coïncide avec e n _\, ou bien encore, e n ~\ est la projection , sur Vespace 
orthogonal à e n , d’un vecteur invariant en direction par A et corres- 
pondant à la valeur caractéristique X n _,. Il est clair que nous aurions 
des résultats analogues pour les autres vecteurs coordonnés ( i ). 


2. La somme de deux matrices canoniques est une matrice canonique ; 
en particulier, si A est une matrice canonique, ilenestdemêmedeX — A. 
Il est évident, indépendamment de la démonstration que nous venons de 
faire, que les valeurs caractéristiques de la matrice réduite apparaissent 
dans sa diagonale principale. Si X n’est pas une valeur caractéristique de 
la matrice canonique A, la matrice canonique X — A présente une 
inverse (X — A)" 1 qui est canonique et non dégénérée, comme il est 
aisé de s’en assurer en résolvant le système récurrent d’équations 
linéaires symbolisé par 

Y = (X — A )X. 


Considérons maintenant une matrice A non canonique; la substitution 
unitaire U qui la réduit à la forme canonique réduit aussi sa résolvante 
à sa forme canonique, car 


s’écrit 


tM<X — A )- 1 U 


IM <Rx U = [ U - 1 ( a - A) U ]- 1 ; 


par suite si LH AU est canonique,, U^X — A) U l’est aussi; et si 
U~J (X — A) U est canonique* U~’ est aussi une matrice canonique, 


(*) Voir une solution algébrique de ce problème dans : Schur, Math. Annalen , 66, 
190g; Wintner, § 11 , Chap. I. 
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puisque inverse de malrice canoniqué. Puisqu’il existe une même trans- 
formation unitaire réduisant simultanément à leurs formes canoniques 
respectives les deux matrices À et dix? ces deux matrices sont dites 
cogrèdienles. On peut encore dire que la résolvante de la réduite U~* AU 
d’une matrice A est la réduite U -1 dlxU de la résolvante dix de A; car 


(X — U-*AU)r-i=[U-HX — A)U)-i. 


La forme canonique de Schur nous montre, de nouveau, que les 
valeurs caractéristiques d’une matrice sont invariantes dans une transfor- 
mation unitaire puisqu’c//<?$ apparaissent dans la diagonale de la 
forme canonique ; en particulier le déterminant de la matrice, qui est 
égal au produit des valeurs caractéristiques, est invariant dans une 
transformation unitaire. 

Supposons que nous opérions sur une matrice A qui soit hermitienne; 
cette propriété se conservant par une transformation unitaire, la forme 
canonique de Schur devra être hermitienne, donc se réduira à une 
matrice diagonale réelle. Ce résultat est le même que celui obtenu par 
la méthode classique de réduction canonique à la forme diagonale d’une 
matrice hermitienne, ou, si l’on veut, à la réduction aux axes de la 
forme d'Hermite associée. La méthode de réduction de Schur apparaît 
comme la généralisation de la méthode classique de réduction pour les 
matrices hermitiennes; dans le cas plus particulier des matrices réelles 
symétriques (et des formes quadratiques), la réduction est connue depuis 
longtemps, puisqu’elle est due à Lagrange et Gauss. 

3. Les opérateurs ou matrices normaux. — Nous appellerons opéra- 
teur ou matrice normal un opérateur ou une matrice A permutable 
avec son associé, c’est-à-dire tel que 

AA* = A* A. 

Rappelons que A*= A'. 

Les matrices ou opérateurs normaux forment une classe importante, 
étudiée par Schur et Toplitz, qui comprend comme cas particulier 
les opérateurs ou matrices d’Hermite définies par A = A*, et les opéra- 
teurs ou matrices diagonaux (^). 

Une transformation unitaire U transforme une matrice normale 
en une autre matrice normale; la vérification de cette proposition est 


(*) Car l'associée d'une matrice diagonale est aussi diagonale et deux matrices 
diagonales sont toujours permutables. 
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immédiate : par hypothèse, 


donc 


B = U -1 AU ; 


BB* = U-‘AUU*AMH‘; 


or, U étant unitaire, nous avons 


UU* = i. 


La relation précédente peut donc s Récrire 


Et de même 


BB* = U -1 AA* U. 


B*B = U -1 A* AU. 


Or AA* = A* A; il en résulte que BB*= B*B. Ceci prouve quil suffira 
d’avoir vérifié dans un système particulier de coordonnées que les 
matrices des opérateurs A et A* sont permutables pour être sûrs qu’elles 
le seront dans tout système de coordonnées, c’est-à-dire que les opéra- 
teurs A et A* seront permutables, donc A et A* seront normaux. Nous 
avons signalé que les matrices diagonales sont des cas particuliers de 
matrices normales ; montrons que toute matrice normale a pour réduite 
de Schur une matrice diagonale, ce qui revient à dire que dans la 
géométrie unitaire toute matrice normale est équivalente à une 
matrice diagonale . Une matrice normale, ayant pour réduite de Schur 
une matrice normale, il nous suffit d’établir qu'une matrice , qui a la 
forme canonique de Schur et qui est normale , est nécessairement 
diagonale . 

Soit en effet A = |a^(la matrice considérée; nous avons par hypo- 
thèse (forme canonique) 


Son associée est 
nous avons donc 


et 


atk—o pour k > i. 


A* = 


AA* = 


2-. 

/— *i 


v a v 


2 

/=» 


A* A = 
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Exprimons que la matrice A est normale; nous obtenons 

n n 

p° i,r **, *= i, 2, . . «. 

/-I /=| 

Dans le cas particulier où i — k , cette formule se réduit à 

n « 

a ij a ij — a j i «/ i ) 

/=! /=« 

soit 

/ /t 

21 1 ^ |4 = 21 |ct/# *** 

/=l /=* 


en tenant compte des termes nuis de la matrice A. 

La somme des carrés des modules des éléments de la ligne i ou de la 
colonne i situés au-dessous de la diagonale principale est la même . 
Faisons d’abord i égal à i; il vient 


c’est-à-dire 


ce qui entraîne 


n 

i «u i 2 =2i a /i i 2 » 

i=i 

n 

2l«/i l*= 

/=* 

«21 = «31 =... = «//!= O . 


Tous les éléments de la première colonne, situés sous la diagonale prin- 
cipale sont nuis. Si donc, au lieu de donner à i la valeur i, nous lui 
donnons une valeur supérieure à i, nous avons 

i n 

2i at} i 4 a j i 

/=2 i-i 

En particulier, pour i — 2 , nous obtenons 

n 

i»» r-=2]i a /* |s > 

/= 2 

c’est-à-dire 

n 

2l^l‘ = o; 

/=» 


ce qui entraîne 
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Tous les éléments de la deuxième colonne, situés sous la diagonale prin- 
cipale sont nuis. Si donc, au lieu de donner à i la valeur 2 , nous lui 
donnons une valeur supérieure à 2 , nous avons 

i n 

/— 3 /=< 


En particulier, pour i = 3, .... Il est clair, qu’en opérant ainsi de 
proche en proche, nous démontrerons que tous les termes situés sous la 
diagonale principale sont nuis; or, par hypothèse, ceux situés au-dessus 
de la diagonale principale le sont également; il en résulte que la matrice A 
présente bien la forme diagonale. Nous pouvons dire, en abrégé, que 
les matrices diagonales sont des normales réduites. 

La proposition précédente nous permet d’affirmer qu’i7 existe bien 
des matrices qui ne sont pas normales ; il suffit d’envisager une matrice 
de Schur ayant des termes non nuis au-dessous de sa diagonale princi- 
pale; par exemple, 

A = 

Vérifions, comme exercice, que celle matrice n’est pas normale; à cet 
effet cherchons son associée; c’est 




Et nous constatons bien que les deux matrices AA* et A*A ne sont 
pas égales puisque 



A* A = 


I o 


O O f 


4. Indiquons quelques propriétés évidentes des matrices équivalentes 
en géométrie unitaire , dont nous avons déjà rencontré les analogues à 
l’occasion des matrices équivalentes en géométrie homogène linéaire 
( voir Ghap. II, § II). 

Deux matrices A et B sont équivalentes dans la géométrie unitaire s’il 
est possible de trouver une matrice uditaire U telle que 

B = U --1 AU. 

Si deux matrices sont équivalentes, elles le demeurent après une trans- 
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formation unitaire V ; en effet, 

V-i BV = V-i LM AUV = V-i U-i VV-i AVV-* U V ; 

soit 

( V-i BV ) = [ V~i U V ]-»( V-i AV)[V- 1 UV ]; 

or la matrice V-'UV, produit de trois matrices unitaires, est unitaire; 
ce qui démontre la proposition. 

L’ensemble des matrices équivalentes à une matrice A, forme une 
classe de matrices équivalentes dans la géométrie unitaire , car deux 
matrices quelconques de l’ensemble sont équivalentes; nous avons par 
hypothèse 

B = U " 1 AU, soit A = UBTJ— 

C = V-*AV; 

d’où il résulte que 

G = V~ l UBU-i V = [ U - 1 V ]-i B [ U - 1 V] ; 

et il suffît de remarquer alors que la matrice U”' V est unitaire. Il est 
aussi évident qu’une matrice équivalente à une matrice de la classe 
appartient à la classe. 

Nous pouvons encore dire qu’une classe de matrices équivalentes est 
constituée par V ensemble des matrices représentant un même opéra- 
teur linéaire dans tous les systèmes normaux de coordonnées. Si deux 
matrices A et B sont équivalentes, elles auront une même matrice réduite 
de Schur et réciproquement. En particulier, si deux matrices normales 
A et B sont équivalentes, elles auront une même matrice diagonale 
réduite de Schur et réciproquement; mais les éléments de la diagonale 
de la matrice de Schur sont les valeurs caractéristiques, donc deux 
matrices normales équivalentes ont même valeurs caractéristiques. Nous 
allons montrer que, réciproquement, deux matrices normales A et B 
ayant mêmes valeurs caractéristiques sont équivalentes dans le 
groupe unitaire . En effet, leurs matrices réduites de Schur sont des 
matrices diagonales ayant mêmes éléments à V ordre près ; il nous 
suffit donc de prouver que par une (ou plusieurs) transformation 
unitaire, nous pouvons permuter, de telle façon que nous le désirons, 
les éléments d’une matrice diagonale. 

En opérant de proche en proche, comme on le fait par exemple en 
arithmétique pour démontrer que le produit de plusieurs nombres est 
commutatif, nous sommes ramenés à démontrer que par une transfor- 
mation unitaire il est possible de permuter deux éléments consécutifs 
de la diagonale principale d’une matrice diagonale; prenons les deux 
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premiers éléments, pour fixer les idées, et montrons donc que les deux 
matrices 


h 

o 

o 

o 

0 



X, 

o 

0 

0 

... o 

0 

À 2 

o 

0 

0 



0 

Xl 

0 

o 

... 0 

o 

0 

X* 

o 

o 


B = 

o 

o 

A 3 

o 

o 






et 






0 

o 

o 

X4 

... o 



0 

0 

0 

h 

... o 

0 

o 

0 

0 

■ • • A, J 



0 

0 

0 

o 

... x w 


sont équivalentes dans le groupe unitaire. Démontrons qu’il existe une 
matrice de permutation P transformant la matrice A en la matrice B. 
Nous désignons, sous le nom de « matrice de permutation », une matrice 
qui a dans chaque ligne et dans chaque colonne un élément non nul 
et un seul , cet élément étant égal à i; les matrices de permutation 
vérifient 

PP'=i, 

car l’élément général de la matrice produit est 

^nuaki; 


et puisque dans une colonne il n’y a qu’un élément non nul, an et au 
ne pourront être simultanément non mils que si i = k ; dans ce cas, cela 
ne sera réalisé que pour un nombre /, leur donnant à tous deux la 
valeur i; soit 

lanaki= o/*. 

De la relation 

PP' = i 


nous déduisons 


PP* = j, 


puisque la matrice P' est réelle, c’est dire P — P'; les opérateurs de 
permutation sont donc des cas particuliers des opérateurs unitaires. 
Envisageons alors 

0 i o o ... o 

1 o o o ... o 

p __ O O 1 o ... o 

OOO I ... 0 

. . . . ... o 

O O O O ... 1 


nous voyons que 


P = P', 



ce qui entraîne 
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P = P-t ; 

nous obtenons alors successivement 


0 

X, 

0 

0 


0 

X, 

0 

0 

0 


0 

0 

0 

Xn 

0 


0 

0 

0 

0 

Xv 


0 

0 

0 

0 

0 


x„ 

X, 

0 

0 

0 


0 

0 

x, 

0 

0 


0 

0 

0 

X, 

0 


0 

0 

0 

0 

Xi 


0 

0 

0 

0 

0 


X/, 


Donc si A. et B normales ont même spectre, leurs réduites U~‘ AU 
et V -1 BV sont équivalentes par une matrice de permutation (donc 
unitaire) 

U-’ AU = PV«BVP-', 

soit 

A = UPV"^BVP-a-' = (YP~i U -1 B (VP —I U -1 ;; 

d’011 il résulte que les matrices A et B sont équivalentes dans la géo- 
métrie unitaire . 

Conclusion. — Le spectre d'une matrice normale est un système 
complet d y invariants par rapport au groupe unitaire , qui caractérise 
la classe de cette matrice dans le groupe unitaire. 

5. Résolvantes des matrices normales. Spectre. Solutions propres. — 

Nous avons montré qu’une même substitution linéaire réduit la matrice 
A et sa résolvante dix = (X — A)"* 1 à leurs formes canoniques; nous 
allons donc prendre la matrice A sous sa forme normale qui est diagonale, 
soit 

A =|| 5,* M|, 

les nombres X; étant les valeurs propres ; nous en déduisons immédiate- 
ment 

X — A = ||( X — X/) || 



m 
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Réciproquement, si dix présente cette forme, la matrice A est diagonale 
donc normale réduite. 

La résolvante dix a les pôles simples X = X,*; il est clair que cette pro- 
position se conserve par toute transformation unitaire déterminée par 
une matrice U, autrement dit U"” 1 dix U a aussi tous ses pôles simples. 
Par conséquent, si la matrice A a une résolvante à pôles simples, il en 
est de même de la matrice U~' AU. Finalement, nous voyons que toutes 
les matrices normales ont des résolvantes à pôles simples. 

Plusieurs valeurs du spectre peuvent être confondues; désignons 
par X (1) , X (2 >, . . ., W les valeurs propres distinctes, ayant respective- 
ment pour ordre de multiplicité s,, s 2 , . . ., s p ) et considérons l’équa- 
tion 

(1) ( XU) — A)X = o, 

relative à une matrice A normale . Nous savons que cetlte équation 
présente des solutions X non nulles ; nous allons voir que dans le cas 
des matrices normales elle présente sj solutions linéairement indé- 
pendantes, s j désignant l’ordre de multiplicité de la racine caractéris- 
tique 1 (J 'K Nous pouvons toujours supposer la matrice A sous forme 
canonique, ce qui revient simplement à choisir convenablement le 
système de coordonnées avec lequel nous allons opérer. L’équation 
précédente devient alors 

||(XM — Xi)$rt || X = o, 

ce qui résume symboliquement le système d’équations 

(2) (X</» — = o pour i — i, 2, 

Pour les valeurs de i correspondant à Xj W) nous aurons Xi = o; pour 
les valeurs de i correspondant à Xj = Xt/), nous aurons xi arbitraire; or 
ces dernières valeurs x\ sont au nombre de Sj. Les solutions du système 
d’équations ( 2 ) dépendent donc bien de sj constantes arbitraires ; ce 
système présente Sj solutions élémentaires linéairement indépen- 
dantes , X} 4> , XJ 3 ’, . . . , XjT/\ dont les coordonnées se trouvent dans les 
colonnes du tableau suivant : 


x</>, xj a) , x} 3 \ ..., xjr/>, 
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coordonnées correspondant : 

Aux indices i pour lesquels h ÿé \U) ; 

o o o ... o 

0 o o ... o 

indices i pour lesquels X* = X (/) : 

1 o o ... o 

o l o ... o 

O O I ... o 

o o o ... ï 

indices i pour lesquels X; Xt/) : 

o o o ... o 

o o o ... o 

Il est clair que ces solutions sont linéairement indépendantes, et que 
Pensemble de toutes les solutions obtenues de la même manière en 
donnant successivement à j les valeurs 1,2, sont linéairement 

indépendantes. 

Nous voyons donc que, pour une matrice normale , à un nombre 
quelconque de valeurs propres distinctes ou non correspond le même 
nombre de solutions propres linéairement indépendantes. 

Toutes les propriétés précédentes relatives aux matrices normales, 
s’appliquent en particulier aux matrices hermitiennes, dont nous ferons 
une étude détaillée dans le prochain chapitre, et elles expliquent les 
propriétés particulières de ces matrices. 

6 . Normes matricielles d’une matrice quelconque. — Introduites par 
Schur, les normes matricielles différencient encore les matrices normales 
des matrices non normales. 

Nous avons désigné par norme d’un vecteur X (matrice à une seule 
colonne ) l’expression 

X*X = |X|*. 

Nous généralisons et appelons normes matricielles d'une matrice A, 
les deux matrices A* A et AA*; la première est dit e norme antérieure et 
la seconde norme postérieure . Les deux normes d’une matrice quel- 
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conque sont des matrices hermitiennes , donc normales, puisque 
(AA*)* = AA* et ( A*A)* = A* A. 

Si la matrice A est normale, ses deux normes sont égales ; si la matrice A 
n’est pas normale, ses deux normes ne sont pas égales. Rappelons les 
deux formules suivantes démontrées antérieurement (voir Chap. 3, § f, 
n° 9). 

n n 

AA*(X, X) = X*AA*X =22 0,1X1 
X' = 1 i = 1 
n n 

A*A(X, X)= X* A*A X =2 2 “'*** 

i = 1 X = l 

Les deux formes d’Hermite associées aux normes matricielles sont donc 
définies positives. 

Nous avons aussi démontré 

Trace( AA* ) = Trace(A*A) I a it I 2 ? 

ik 

celte valeur commune s’appelle la trace normale (normalspur) de la 
matrice A. 

La trace normale d’une matrice A étant invariante par une transfor- 
mation unitaire (’), nous pouvons la calculer sur la forme réduite de 
Schur || xik ||; il devient alors évident que : 

Trace (AA*) | aa | 2 | a u | 2 | X* | 2 si A n’est pas normale; 

t,k i i 

Trace(AA*) — ^ I a ik I 1 =2 I a “ ^ ^ ^ I* ^ est normale. 

i, k i i 

Nous allons montrer que les deux normes AA* et A* A d’une matrice 
quelconque A sont toujours équivalentes dans le groupe unitaire; 
puisque les normes sont des matrices hermitiennes, donc normales, il 
nous suffit, pour cela, de prouver qu’elles ont même spectre. Soit à 
établir que les deux équations 

dét (X — AA*) = o et dét(X — A* A ) = o, 
ont .mêmes racines. Envisageons d’abord le cas général où la matrice A 


(*) Voir Chap. II, § IV, n» 5. 
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n ? est pas dégénérée; elle présente alors une inverse et nous avons 

A - 1 A A* A = A* A, 

ce qui nous prouve que la norme A* A est transformée de la norme AA* 
par la matrice A; d’après une propriété classique, elles ont alors même 
polynôme caractéristique^ vo/rChap. II, § II, n° 4 ) 

dét ( X - AA*) = dét ( X - A* A ). 

Si la matrice A est dégénérée, nous pouvons nous ramener aisément au 
cas précédent. En effet X = o est une valeur propre isolée de la 
motrice A, puisque les valeurs propres sont en nombre fini. Si nous 
choisissons s quelconque, mais de module suffisamment petit et non 
nul, la matrice 

B = e — A 

ne sera pas dégénérée; et nous aurons par conséquent 
dét (À — BB*) = dét(X — B* B); 

cette relation étant vérifiée quelque petit que soit e, nous obtenons, en 
passant à la limite 

dét (X — AA*) = dét(X — A* A). 

Nous ne nous étendrons pas plus sur l’élude des matrices normales, 
on pourra compléter les résultats donnés en consultant le Mémoire de 
Schur {Math. Annalen , t. 66, 1909). 
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ÉTUDE PARTICULIÈRE DES MATRICES ET OPÉRATEURS HERMITIENS. 


I. - RÉDUCTION. 

1. Les matrices hermitiennes sont les matrices égales à leur associée, 
soit A = A* ; nous avons donc 

AA* = A* A = A 5 . 

La matrice À a est aussi hermitienne puisque (AA*)* = AA*. 

Spectre. — En remarquant que toute matrice équivalente .dans le 
groupe unitaire à une matrice hermitienne est aussi une matrice hermi- 
tienne, nous avons démontré que la matrice réduite de Schur d’une 
matrice hermitienne est diagonale et a tous ses termes réels et réci- 
proquement. Nous pouvons dire que les matrices hermitiennes sont les 
matrices normales à spectre réel. 

Espaces propres. — Soient donc A (1 >, A 12 ), A ( *i les racines 
distinctes de l’équation caractéristique de l’opérateur hermitien A; elles 
sont réelles et ont respectivement comme ordre de multiplicité s,, 
s 2 , ... s p . L’équation 

(A</r-— A)X = o 


définit un espace vectoriel E ( -/) à Sj dimensions, ainsi que nous l’avons 
montré dans le Chapitre précédent. Il est clair que ces espaces Et 1 ), 
E (2> , ..., E'/'> sont invariants par l’opérateur A. Montrons que ces 
espaces sont deux à deux orthogonaux ; soient en effet un vecteur X ( 
de l’espace E ( ') et un vecteur X" de l’espace E (A > ; nous avons 


(AUI — A)X' = o, 
( AW— A)X ff = o, 
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ce qui peut s’écrire 

ax' = mx', 

AX" = X<*)X ff . 

Multiplions scalairement à droite la première de ces relations par X" et 
à gauche la seconde par X'; retranchons. Il vient 

(AX # , X')-(X', AX") = [537) - xw] ( ;x', X"). 


L’opérateur A étant hermitien le premier membre est nul ( voir n° 8, 
§ I, Chap. III). Il en résulte; puisque V j) = réel est différent de X (A >, 
que 

(X', X") = o. 


Les sous-espaces propres sont donc deux à deux orthogonaux ; en parti- 
culier ils sont disjoints . Puisque la somme de leurs nombres de dimen- 
sions s h -}- s 2 -4- • • • + s P est égale à /z, ils.forment donc une décomposition 
de l’espace 

E = Et h- E< 2 ) H- ... -h EW. 


Les sous-espaces étant orthogonaux nous pouvons adapter à cette 
décomposition de l’espace un système de coordonnées normal formé par 
la réunion de systèmes de coordonnées normaux quelconques de chaque 
sous-espace. 

Les sous-espaces étant invariants, la matrice réduite de À se réduit à 
une suite de p matrices situées le long de sa diagonale principale, ayant 
respectivement pour ordre s s a , s p et représentant l’opérateur 
induit par A dans le sous-espace correspondant. Or, dans le sous- 
espace E (/) , nous avons 

AX = X«>X. 

Il en résulte que l’opérateur induit A, se réduit à un opérateur scalaire 
de multiplication 


w 

0 

O 

... 0 

0 

XU) 

O 

... 0 

0 

0 

X<*> 

... 0 

0 

0 

O 

. . . X") 


quel que soit le système de coordonnées normal choisi dans E (/ >. 

Finalement, relativement à un système de coordonnées normal quel- 
conque adapté à la décomposition de l’espace E en les sous-espaces 
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l’opérateur hermitien A possède la matrice réduite 



Nous avons donc un certain arbitraire dans le choix du système d’axes 
donnant la forme réduite. Toutefois, si les racines caractéristiques étaient 
simples, les axes de coordonnées seraient imposés (à une permutation 
près). 

Par définition, l’équation 

AX == aX, 

définit le sous-espace propre à a; si a n’est pas une valeur caracté- 
ristique le sous-espace propre correspondant est vide; si a est une 
valeur caractéristique li le sous-espace propre correspondant est non 
vide et n’est autre que le sous-espace 

2. Envisageons la forme d’Hermite associée à la matrice A; elle 
s’écrit 

n 

A(X,X) = X*AX = y] a lk 7iX k . 

i,k = 1 

Si nous effectuons le changement d’axes unitaire défini par la matrice 
unitaire U 

X = us, 

la forme d’Hermite devient 

X*AX = E*U*AÜE. 
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Elle correspond donc dans les nouveaux axes à la matrice 

U* AU = U -1 AU. 

Choisissons pour U la transformation unitaire ramenant la matrice A à 
sa forme canonique ||X,- àu ||; la forme d’Hermite associée sera également 
ramenée à sa forme canonique 


2 ^i****' 

1= 1 

Etant donné un opérateur hermitien A, nous pouvons donc toujours le 
rapporter à des axes de coordonnées normales et ( axes principaux) 
tels que, pour X = x K e K + . . . -b oc n e n , on ait simultanément 

n 

A(X,X)=2 W*;, 

i = 1 
n 

(X; X) = 

i - 1 

les h sont les valeurs propres de l’opérateur A; les vecteurs coordonnés 
sont les vecteurs propres de l’opérateur. 

Désignons par X f * la projection orthogonale du vecteur X sur le sous- 
espace E (I 'J et posons 

®X (ri (X) = (X/, X,). 

On a par exemple 

x, = Xi€i -4 - . . . -h Xs t e St , 

Exw(X) = X\X\ -h . . . x Sx x s% — (Xj, Xi). 


Il résulte de cette définition que nous avons 

(X,X)=2 E«(X), 

a 

A(X, X)=2«E a (X), 
a 

formules dans lesquelles <x prend successivement les valeurs 
X( 2 ), . . XW, ou bien encore où a prend ioutes les valeurs en faisant 
la convention 

E a (X) = o si a est différent de tous les XW, 

E a (X) ='Ex(i)(X) si a est é^al à XW. 
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Considérons les projections orthogonales X*, X 2 , . . . , X,, d’un vec- 
teur X sur les sous-espaces E^, E (a >, . E ( ^; X,: sera obtenu à 
partir de X par un opérateur E; de projection tel que 

X* = EiX. 

Ces opérateurs E; sont en même nombre que les valeurs caractéris- 
tiques distinctes ; dans le système canonique de coordonnées l’opérateur 
E/ possède la matrice E; 


0 

O 

0 


1 I « 


O 

1 . 

0 


° ’• I 


O 

0 

O 


dite matrice de projection ( Einzelmatrix des Allemands). Elle se 
déduit de la matrice unité en ne conservant que les termes des lignes et 
colonnes conduisant dans la matrice réduite de A, à la valeur carac- 
téristique \ (i) dans la diagonale principale, les autres termes étant 
remplacés par zéro. Nous avons évidemment les deux relations matri- 
cielles suivantes : 

<= 2 E «> 

X 

A =2 « E *- 

a 

Les E i n’admettent évidemment que les valeurs propres o et i . Et il est 
clair que E* = E t . Nous verrons que la réciproque est vraie. 

3. Ttfut opérateur de projection sur un sous-espace quelconque E (l > 
est un opérateur hermitien. Décomposons, en effet, l’espace E en deux 
sous-espaces complémentaires E<*> et E (2 > orthogonaux , un vecteur deE 
sera la somme de deux vecteurs appartenant chacun à l’un des sous- 
espaces 

X = X t -+-X 2 avec X 4 = EiX, 

Y = Y, Yj avec Y t = Et Y. 
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Nous avons 


(Xi, Y) = (Xi, Y t + Y,) = (Xi, YO + (X„ Y,) = (X,, Y 4 ) 


et de même 


d’où 

Soit 


(X, Yt) = (Xi 4- X 2 , Y t ) = (Xi, Yt)-h(X 2 , Yt) = (X,, Y,), 


(Xi, Y) = (X, Yt). 


(EtX, Y) = (X, Et Y), 


relation qui, vérifiée pour X et Y quelconque, caractérise un opérateur 
hermitien. D’autre part X*E* X est le carré de la longueur du vecteur X* , 
Désignons par E a l’opérateur de projection faisant passer de E à E (a >, 
autrement dit i — E,, (X 2 = E 3 X donne X = EiX + E 2 X, c’est-à- 
dire E 2 = i — Et). Les sous-espaces E<^ et E< Q > étant orthogonaux nous 
avons 

EiE 2 = o; 


et de même E 2 Et = o qui pourrait se déduire de la première relation en 
prenant son associée et en remarquant qu’un opérateur hermitien est 
égal à son associé. Les opérateurs E< et E a sont dits indépendants . 
Cette relation peut encore s’écrire 


ou bien 
de même 


Et(i — E, ) = o 
Et = E?, 

E s = E!j. 


Si un espace est décomposé en p espaces deux à deux orthogonaux E ( *>, 
E (2 ), E ( ^, les opérateurs de projection correspondants étant E<, 

E 2 , . . . , E,,, nous aurons 

X = EtX-f-E 2 X h- E,X, 
et l’on vérifie aisément 

EfEy = §ij E/. 

Montrons que, réciproquement , si un opérateur hermitien satis- 

fait à E^ = E| , c’est un opérateur de projection . 

En effet l’opérateur E a = i — E< est aussi hermitien et satisfait à la 
même relation, car 


Eq = (i — Ei) â = i — 2 Et -h E 2 = i — Ei = E a . 
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ïi Eg = Ei(i — Ej ) = Ei — Ef = o. 

Les deux opérateurs E, et E 2 sont donc indépendants. De plus, puisque 

i = Ej -4- E*, 

tout vecteur X est décomposé en une somme de deux vecteurs 

X = E 1 X + E S X ) 

appartenant aux deux sous-espaces 

E< J ) = E t X pour X arbitraire, 

E(*) = E 2 Y pour Y arbitraire. 

Ces deux sous-espaces sont orthogonaux (donc disjoints), car 
(E,X, E 2 Y) = (X,E 1 E 2 Y), 

puisque Ei est hermitien et cette expression est nulle en vertu de la rela- 
tion E 4 E 2 = o. 

La décomposition X = E! X + E 2 X comprend donc un vecteur E, X 
dans un sous-éspace E 1 et un vecteur E 2 X orthogonal à ce sous-espace; 
E,X est donc la projection orthogonale de X sur E 1 ; E* est bien un 
opérateur de projection. 

Plus généralement, si les opérateurs hermitiens E*, E 2 , . . ., E^ sont 
indépendants, c’est-à-dire tels que EjE; = E t et EiEj = o si i ÿé.j , ils 
définissent des multiplicités E (l ’> = E/X deux à deux orthogonales; si de 
plus ces multiplicités permettent d’engendrer tout l’espace, c’est-à-dire 
si E = E ( * ) -j- E^ -j- ... + E ( "h nous aurons 

X = EjX + E 2 X+,..+ E«X, 

et l’opérateur E; définira la projection orthogonale de l’espace E sur le 
sous-espace E u) . 

En résumé, toute forme , matrice ou opérateur d'ttermite A fait 
correspondre aux nombres réels a, des opérateurs , formes ou matrices 
de projection E a , indépendants , tels que 

i = 2 E., 

a 

A=^«E a , 

a 
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les l&i n’étant différents de zéro que pour un nombre fini de valeurs 
de a qui sont les valeurs caractéristiques \i de A. 

Faisons maintenant une remarque importante. Considérons la rela- 
tion 

A=2«E a 

a 

et élevons-la au carré; du fait que les opérateurs E a sont indépendants, 
il vient immédiatement 

A«=2« ! Ea 

a 

Nous pouvons multiplier maintenant cette seconde relàlion par la 
première et ainsi de suite. De proche en proche, nous arrivons ainsi à 
la relation générale 

A * =>£ «A E*. 

a 

Autrement dit les différentes puissances d’une matrice hermitienne 
donnent naissance aux mêmes matrices de projection et ont pour 
valeurs caractéristiques les puissances des valeurs caractéristiques de la 
première. 

Généralisons de nouveau : envisageons un polynôme en A à coeffi- 
cients réels , soit /(A) 

/( A)= c 0 i -h Ci A . . -f- c/ t A A . 

Nous aurons 

/( A ) = co^V| E a -h Ci a E a -+- ... -4- c/j^j^ a/ * E a , 
a a a 

soit 

/(A)=2/(«)E«. 

a 

L’opérateur hermitien /(A), (/ polynôme) donne donc naissance 
aux mêmes matrices de projection que A; ses valeurs caractéristiques 
sont f(h), si nous désignons par h les valeurs caractéristiques de A. 

4. Valeurs de la forme attachée à un opérateur hermitien A. — Con- 
sidérons la forme A (X, X) attachée à l’opérateur A 

A(X, X) = X*AX =2 a lk 7iX k . 

i,k 
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Nous avons vu qu’il est possible de prendre des axes de coordonnées e 
(axes principaux) tels que la forme se réduise à 

n 

A(X, 

i-i 

où Xi sont les nouvelles coordonnées du vecteur X, définies par la 
relation vectorielle : 

X = x 1 ei -4- Xi e t -h . . . -+- x n e n , 

e,, e ÿ , . . . , e n formant un système de vecteurs orthonormaux. 

Nous nous proposons de chercher le domaine décrit dans le plan 
complexe par la valeur de la fonction A(X, X) du vecteur X, lorsque 
celui-ci varie d’une façon quelconque. 

Tous les li étant réels, il est évident que A(X, X) sera toujours réel-. 
Si nous supposons maintenant que toutes les valeurs spectrales X,- sont 
positives, donc supérieures à un nombre positif X, il en résulte que 

n n 

A(X, x;=2 X|X |5; 

<=1 


autrement dit la forme A est toujours positive sauf pour X = o, auquel 
cas èlle est nulle. Nous dirons alors que la forme d’Hermite est définie 
positive . Si, en particulier, nous astreignons le vecteur X à la condi- 
tion | X | = 1, nous aurons 

A(X, X)> X>o. 

Supposons que tous les X; soient positifs ou nuis, Vun d'entre eux 
au moins étant nul . Désignons par X ( ^=o l’ensemble des valeurs 
propres nulies, il vient 

n n 

A(X, X) iXiXi> XiX t , 

i - 1 i - 1 

en désignant par X un nombre inférieur à tous les X; non nuis et par l f 
une somme étendue à tous les indices i compris entre 1 et n et ne corres- 
pondant pas à une valeur caractéristique nulle. Il est clair alors que la 
forme A est positive ou nulle; elle est nulle dans le cas, et seulement 
dans~le cas, où le vecteur X est choisi dans la multiplicité E { ?K 
Remarquons principalement que cette forme prend des valeurs nulies 
pour des vecteurs non nuis; elle est dite définie non négative . 
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Nous pourrions définir de même des formes d’Hermite définies néga- 
tives et des formes d’Hermite définies non positives . 

Étudions, plus généralement le domaine décrit par une forme 
d’Hermite A(X. X) quelconque, lorsque nous astreignons le vecteur X 
à la condition | X | = 1 . Nous avons 

n n 

A(X, X) =2 X,S (a: , =]£>., |*,| s - 

i—l i~l 

Soit X la plus petite valeur caractéristique et A la plus grande. Les 
points représentatifs des nombres X* sont distribués sur le segment (X,A) 
extrémités comprises; si nous les affectons des masses positives | xi | 2 
correspondantes, le centre de gravité de ce système a pour abscisse 

n 

A(X, X)=2>l*il f 

i—l 

puisque 

i=i 

11 en résulte que le point représentant la valeur de la forme A(X, X) 
décrit le segment (X, A) lorsque X varie arbitrairement sur la 
sphère I X I = 1 : 

X ^ A(X, X)< A. 

Le nombre X, minimum absolu de la forme , est atteint pour X~c t 
si X = X t et le nombre A, maximum absolu de la forme pour X = cy 
si A = X/. Le domaine décrit par la forme est donc le plus petit segment 
qui contient le spectre. Dans la suite, nous généraliserons ce résultat. 

5. Applications. — À étant une matrice hermitienne, les valeurs 
propres de A 2 sont égales aux carrés de celles de A. Il en résulte que la 
forme A 2 est toujours définie non négative . Nous pouvons même dire 
que : la condition nécessaire et suffisante pour que la matrice A ne soit 
pas dégénérée est que la forme A 2 soit définie positive (*). La réci- 
proque peut encore s’exprimer de la façon suivante : 

Toute matrice d’Hermite A non négative est le carré d’une matrice 
d’Hermite B. En effet, ramenons A à la forme diagonale 

A = | X* hik J; 


(') Cette propriété s’étend aux matrices infinies (Tôplilz). 
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tous les sont positifs ou nuis. Posons alors 

B = | |; 

B est une forme d’Hermite et il est évident que A = B 2 . 

Si la forme A 2 est définie positive, la matrice A n’est pas dégénérée et 
par conséquent la matrice A~' existe; ses valeurs propres étant >7' il en 
résulte que la matrice À“‘ est définie positive ou définie négative en 
même temps que la matrice A. 

6. Nous avons déjà montré que la condition nécessaire et suffisante 
pour que le produit AB de deux matrices hermitiennes A et B soit 
hermitien est que ces deux matrices soient permutables , c’est-à-dire 
que l’on ait 

AB = BA. 


La condition nécessaire et suffisante pour qu'il en soit ainsi est 
que A et B soient réductibles à la forme diagonale par la même 
substitution unitaire U, autrement dit que les formes d'Hermite 
A(X,X)efB(X, X) aient même axes principaux, 

La condition est suffisante. En effet, il nous suffit de vérifier que les 
matrices sont permutables dans un système particulier de coordonnées ; 
nous choisirons évidemment le système de coordonnées par rapport 
auquel les matrices prennent toutes deux la forme diagonale. Deux 
matrices diagonales étant toujours permutables, la proposition est 
établie. 

La condition est nécessaire. Supposons donc que nous ayons (dans 
un système quelconque de coordonnées ) 

AB = BA 

et supposons que, par un changement convenable de coordonnées, nous 
ayons ramené la matrice A à la forme diagonale ( 1 ) A = |d/*Aj|. La 
matrice B prendra alors la forme B = | b a J. En écrivant que ces deux 


(*) Cette. forme diagonale se compose de la succession, le long de la diagonale princi- 
pale, des matrices À,, ..., K p correspondant aux valeurs caractéristiques distinctes 
X<*>, . . ,, ») de A. On a 
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matrices sont permutables, il vient 


soit 


t'ibtk— baïk , 
ba(h— ï'k) = 0. 


Si liÿélk, cette relation entraîne 6,*=o. Considérons donc les valeurs 
caractéristiques distinctes auxquelles correspondent 

les multiplicités E (1 >, E< 2 >, . . E^>. Les éléments bik seront donc nuis 

lorsque les indices i et k correspondront à deux multiplicités différentes. 
Il en résulte que la matrice B se décompose en une succession de p 
matrices partielles d’ordres s < , s 2 , . . . , s py en désignant par ces nombres 
les ordres de multiplicité des valeurs caractéristiques c’est-à-dire 
les nombres de dimensions des sous-espaces E (4 >, E (2 >, ..., E ( p), les 
matrices B; correspondant, lignes pour lignes et colonnes pour colonnes, 
aux matrices A; de la réduite A 



Les matrices partielles B 4 , B 2 , . . B ; > sont hermitiennes comme B; or 
nous savons que la matrice A conservera la forme canonique si nous 
effectuons dans chacun des sous-espaces E {, >, E (2 >, . . . , E >/>) un change- 
ment unitaire quelconque de coordonnées . Nous choisirons donc les 
axes de coordonnées situés dans le sous-espace E (1 > tels que la matrice 
hermitienne B 4 se réduise à la forme diagonale; et nous ferons de 
même pour les autres sous-espaces. Finalement nous sommes parvenus 
à réduire simultanément à la forme diagonale les deux matrices hermi- 
tiennes permutables : le théorème est démontré. 

Ce théorème peut s’étendre à un nombre quelconque fini ou à une 
infinité d'opérateurs : 

La condition nécessaire et suffisante pour qu'un nombre fini ou 
une infinité d'opérateurs ( ou matrices) d'Hermite soient deux à deux 
permutables est qu'une même substitution unitaire les réduise tous à 
la forme diogonale (* ). 


(*) Voir Wbyl, Chap. I, § 5. 
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7. Décomposition spectrale d’un opérateur hermitien A. — Nous 
exposerons celte question sur les opérateurs ou les formes d’Hermite, 
les notations étant plus simples. Hilbert, puis Hellinger ont employé 
une méthode de réduction, qui a permis d’en faire l'extension à des 
classes très générales d'opérateurs hermitiens de l’espace à une infinité 
de dimensions, où le spectre présente une infinité de valeurs qui ne 
sont pas nécessairement discontinues. 

Considérons un opérateur A et ses valeurs propres distinctes rangées 
par ordre croissant X* 1 ) < X (2) < . . . < Vp ] dont les ordres respectifs 
sont s { , s 2f ..., s p . Nous avons fait correspondre à chaque nombre 
réel a un sous-espace EM formé par les vecteurs X satisfaisant à 
(a — A)X = o et un opérateur hermitien E a définissant la projection 
orthogonale sur le sous-espace E (a) . Rappelons que si a n’est pas égal à 
une valeur caractéristique. E a est nul, tandis que si a est égal à une 
valeur caractéristique, E a n’est pas nul, et que nous avons les relations 

E a E a = E a , 

E a Ë 3 = o si a ^ [3, 

la première relation exprimant que les opérateurs sont des opérateurs de 
projection, la seconde qu’ils sont indépendants. 

Hilbert introduit un opérateur (ou matrice) dépendant d’un para- 
mètre X, défini par la relation suivante : 

E(X) = 2 e «- 

Par conséquent, lorsque X varie, l’opérateur E(X) prend les valeurs 
X£X<o, E(X) = o, 

XW< XgXW, E(X) = E x <i>, 


X(*i<XgX(*) f E(X) = E X (i)H- E X ( 2 ), 

X</>) < X, E ( X ) = E x u) -h E X (î) 4- ... -h E y[ p ) = i . 

Parallèlement nous introduirons 


Soit 


A(X)=2aE a . 

a<X 


X^XU), 

XU)<XgX(*>, 

xw< xgxw, 

J 

Xïp)< X, 


A(X)=XWE X <|), 

A(X) = XU)E X ü)H-X(*)E X(î) , 

• 

A(X)= XUIE x ,,)H- X(«t E X(J) + X(/»E X( ,)= A. 
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Si les valeurs caractéristiques formaient un spectre' continu, les 
expressions E(X) et À(X) varieraient continûment. 

Donnons quelques propriétés des opérateurs E(X). 

a. Nous avons 

E(X)E(X) = E(X), 


car le premier membre s’écrit 



= 2 E «> 

oc<X 


en exprimant que les E a sont des opérateurs de projection indé- 
pendants. 

b. Si X < p, nous avons 

E(X)E({x) = E([x)E(X) = E(a), 


car dans ces conditions 


et 


E( fi )= E(X)-4-’2 E* 




E(X)E(n) = E(X)E(X) + E(Xj ^ E «. 

A£a<{! 

Or, d’après la propriété a, 

E(X)E(X) = E(X) 


et, d’après l’indépendance des opérateurs, 

E(X)/ 2 E a \ = o. 

W«0 / 

Nous établirions de la même manière que 

E( (j.) E( à) = E( X). 

Ces deux propriétés peuvent se résumer dans la relation suivante : 
Si X < /ül, 

' E(X)E(|x) = E(p)E(X)=E(X). 


c. Si X tend vers — oo, E(X) tend vers zéro (dans le cas particulier 
étudié la limite étant déjà atteinte pour X (1 >. 

d. Si X tend vers -f-op, E(X) tend vers un (dans le cas particulier 
étudié la limite étant déjà atteinte pour X0>). 
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Si une famille d’opérateurs hermitiens jouit de ces proprié l^s elle est 
dite une décomposition de V unité. Il résulte de cette définition' que : $ 
un opérateur hermitien A correspond une décomposition de Vanité qui 
permet d'exprimer A(X). 

Si X < /A, nous poserons 

E( l i)-E(X) = AfE(X)^A t E(X), 

a désignant l’intervalle défini par La notation ab représen- 

tant la partie commune aux deux intervalles a et b, nous avons 

A a E(X) x Ai,E( X) = A a i> E ( X ), 

comme on peut s’en assurer immédiatement en s’appuyant sur les pro- 
priétés des opérateurs E a : opérateurs de projection indépendants. En 
particulier, si les intervalles a et b sont disjoints ou contigus, la relation 
précédente devient : 

A*E( X) x AbE( X) = o. ( Relation d’indépendance.) 

Si a se réduit àX (t) on a A^u) — E^/). Partout ailleurs A a = o. 

Hellinger, dans le Journal de Crelle (t. 136) a généralisé ces notions 
et introduit des solutions propres différentielles. 

8. Avant de poursuivre, nous allons maintenant rappeler rapidement 
quelques notions relatives à V intégrale de Stielljes (*). 

Considérons deux fonctions f et g définies dans un intervalle a( 3, 
f continue et^ à variation bornée. Divisons cet intervalle en intervalles 
partiels; désignons par A;# la variation de la fonction g dans le i ,àmc 
intervalle et par ^ un point de cet intervalle. Formons alors la somme 

V(WA^ 

étendue à tous les intervalles partiels. On démontre que lorsque le 
nombre des intervalles partiels augmente indéfiniment, leur longueur 
tendant vers zéro, cette somme tend vers une limite indépendante du 
choix des intervalles partiels, que l’on appelle intégrale de Stieltjes et 
que l’on désigne. par la notation 

f f d S‘ 


( l ) Voir Stieltjes, Annales de Toulouse, 1894 , 1895 * 
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Envisageons maintenant une distribution m(X) de niasses réparties 
sur Taxe réel; soit une fonction f (X) continue. D'après la définition de 
l’intégrale de Stieltjes, nous aurons 

/ . = lîm [2/(X/) A*m], 

J 7. 

en désignant par A;m la masse répartie sur Je / ,ème intervalle partiel et 
par X/ un point de cet intervalle. Dans le cas particulier où la distribution 
de masses a une dérivée (ou densité) en chaque point, l’intégrale de 
Stieltjes se ramène à une intégrale ordinaire 

/* P r P dm 

j f(\)d X m=j /(X)^rfX. 


Mais l’intégrale de Stieltjes peut aussi exister sans que la distribution 
de masses présente une densité; par exemple, supposons que la masse 
soit concentrée aux points X<'>, X (,J) , .... Vf) et désignons par nu la 
masse située au point X (t) ; nous aurons alors l’intégrale sous forme d’une 
somme de termes en nombre fini 





d\in = 2 * fO M) ) m i • 

i 


9. Ce dernier exemple se rencontre en particulier dans le spectre 
discontinu que nous sommes en train d’étudier; les intégrales que nous 
allons écrire porteront sur des matrices, mais nous pouvons les consi- 
dérer comme un langage symbolique indiquant les opérations à effectuer 
sur chaque terme des matrices. Nous aurons 

\E(J.) = o, 

si le i ièm,î intervalle partiel ne contient pas de points du spectre; 

A i E(X)=E X> 

si le t ,èmo intervalle partiel contient le point X/ du spectre. 

Par conséquent, les relations 

e — £ E(t) 

A = S«E U , 

obtenues précédemment, peuvent s’écrire 

1 =J + ^E(X) = lim[SA. i E(X)), 


JULIA 
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les Ri décomposition arbitraire de ( — oo, 4-oo) 

À = / XdxE(X). 

Cette forme intégrale est surtout intéressante parce qu’elle permet la 
généralisation de ces résultats. 

Nous pouvons opérer sur les formes associées aux opérateurs ou aux 
matrices, au lieu d’opérer sur des matrices, ce qui donnera lieu à des 
égalités entre nombres (et non entre opérateurs) et à de véritables 
intégrales deStieltjes(ei non à des intégrales symboliques). Nous avons 
E( X, X,X) = X*E(X)X = [X, K(X)X j, 

A(X, X, X ) = X*A( X)X = [X, A(X)X|, 

E(X, X, X), est, pour chaque X, un nombre > o croissant avec X. 

Nous pouvons faire sur ces formes les mêmes raisonnements que nous 
avons faits sur les matrices. Nous obtiendrons les mêmes équations et 
nous aboutirons finalement aux deux relations 

<X,X) = |X|«= 

A(X, X)=y’ + "/.rf x E(À ) X,X). 

Citons encore la relation 

(X, AY>=jf + "x«4[X, E(X) Y !, 

qui est équivalente à 

A Xdi E(X) 

et à 

A(X,X)= X, X). 

Sous cette forme intégrale , Hilbert a montré que ces formules sont 
encore vraies pour les opérateurs hermitiens bornés de V espace de 
Hilbert . 

En résumé , un opérateur hermitien A fait correspondre à tout inter- 
valle A, un opérateur hermitien de projection AE. Pour deux intervalles 
contigus A| et A 2 , nous aurons 

AE = AiE -h A â E, 

en désignant par A l’intervalle formé par la réunion des précédents. Si 
les intervalles A* et A a sont sans point commun nous aurons 

AiE A S E = o. 
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et, de plus, 

1 = J </ x E, 


/* + » 

=J Kdx E. 


10. La méthode de décomposition spectrale d’un opérateur hermitien 
peut être présentée sous une forme matricielle purement algébrique 
dont nous donnerons seulement ici un aperçu. (Pour le détail du calcul 
voir , par exemple, Wintner, Spektraltheorie der unendlichen 
Matrizen , p. 49*) 

Soit A = J «/a- J la matrice hermitienne envisagée. IJ = | w,* | la matrice 
unitaire réductrice, la matrice Ux\U~‘ étant diagonale, UAU~' = |X,di*|, 
les li étant les valeurs propres de A. Gela veut dire que si Y = AX 
est un opérateur de l’espace E, t , les vecteurs Sù = CJX et = UY 
de l'espace transformé & = UE seront liés par l’opérateur 

^UAU-'#. 

Considérons la* matrice E(p) = ||cr t/ t(p) [ définie, pour tout p réel, par 

sain) =2 “/'“/*• 

chaque ^ix(p) est une fonction discontinue de p, variant par saut 
brusque lorsque p traverse les valeurs propres distinctes X fn , . . 
de A, constante dans l’intervalle de deux de ces valeurs propres. 

On montre : i w que, quel que soit l’ordre dans lequel les Xy sont 
rangées, E ( p ) reste la même ; 2 0 que E(p), constante dans l’intervalle de 
deux valeurs propres distinctes est telle que 

K({jl) = o si [Ji < X( l >, plus petite valeur propre, 

K( )=t 1 si p> X< l ) f plus grande valeur propre, 

c’est-à-dire E( — 00 ) — 0 , E(-f-oo) = 1 , ce qui se vérifie par 

°ik = / da ik (p). 

E(p) est d’ailleurs hermitienne, quel que soit p réel, et l’on vérifie que 


au- 




pdaik(t±). 


3° On montre enfin que 

L(X) E({x) = E(jx) E(X) = E(X) 


X< 
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L’ensemble des propriétés précédentes montre que E(j u) possède toutes 
les propriétés étudiées aux n os 7-9 et que l’on a bien 


ou encore 


^E, A =zj 

(X, AY)= J + F u* |l (X t B(|»)Y) 


pour tout couple de vecteurs X, Y ( 1 ). 


II. — EXTENSION AUX OPÉRATEURS UNITAIRES. 


1. Un opérateur unitaire U est caractérisé par la relation 
UU* = U*U = i. 


En particulier, une matrice unitaire est normale ; sa forme réduite est 
donc diagonale, soit 

u = 11 Mi* B- 

Nous avons alors 
et 


Par conséquent 


UU* = |x,Xj 8 (*|| = i. 

1 X; | 2 = i (quel que soit i). 


Les valeurs propres d’une matrice unitaire ont donc pour module i , 
autrement dit le spectre est tout entier situé sur le cercle unité . 

Réciproquement on vérifie aussitôt qu’une matrice normale, dont le 
spectre est situé sur le cercle unité, est unitaire. 

Etant donné un opérateur unitaire U, il est possible de trouver un 
système normal de coordonnées tel qu’en l’adoptant l’opérateur U soit 


(’) On vérifie aussi que la résolvante de A, c’est-à-dire la matrice 
HR,*a)i! = p‘-A)-i 


est donnée par 
ou, en abrégé. 


/.+ » 

R, .(*> = / 

c/_ 30 

O' — A )-' = f + 
J — » 


dVikip) 

x=ir 

X — JA 


De même, on aura, 4> étant un polynôme quelconque à coefficients réels , 


*(A) = 



ja) do iic ({i) 


= / «KlO^E. 
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ramené à la forme diagonale U = || X; ||. Ce que Ton peut exprimer par 

U ei — Xteij 

est appelé vecteur propre. Si X* est une racine caractéristique 
d’ordre sy, il lui correspondra une multiplicité linéaire invariante E ( ^ 
à sj dimensions, dans laquelle nous choisirons arbitrairement sj vec- 
teurs coordonnés rectangulaires. Les multiplicités E ( ^ sont orthogonales 
autrement dit les solutions propres correspondant à deux racines carac- 
téristiques distinctes sont rectangulaires; démontrons-le directement. 

Soient X, et X 2 deux racines caractéristiques distinctes etX,, X 2 les 
solutions propres correspondantes. Nous avons 

UXi=X 1 X 1 , 

ux 2 = x,x 5 . 

Multiplions la première relation par X 2 ; il vient 
(UXi, X 2 )=>T 1 (X 1 j X,). 

Nous obtiendrons à partir de la seconde relation 


soit 


X* = U-i a*X 2 , 
X 2 = X,U-‘X t> 


ou bien encore, puisque U est unitaire, 


X, = X 2 U*X 2 , 

qui peut s’écrire 

u*x 2 = x 2 *x 2 . 


En tenant compte de cette relation, l’égalité 

(ÜX 1? x,) = x;u*x t = x l (x 1 ,xo 
x 2 *x;x 2 =x 1 (x 1 ,x 2 ), 


devient 


et en remarquant que X 2 a i pour module, donc X 2 ‘ — X 2 , 

x;(x„x 2 ) = x i(Xi,X 2 ). 

Or X, et X 2 étant différents, il en est de même des nombres conjugués et, 
par conséquent 

(Xi, X 2 ) = o. 


Remarquons que, dans chaque espace E {i) invariant par U, nous pou- 
vons choisir un système normal arbitraire de coordonnées sans changer 
la forme diagonale. Il en résulte de même que, pour les matrices hermi- 
tiennes, le théorème suivant : 



1*2 
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La condition nécessaire et suffisante pour qu’un nombte fini ou 
une infinité de matrices unitaires se réduisent par une même substi- 
tution unitaire à la forme diagonale , est qu’elles soient deux à deux 
permutables . 

2. Relation de Cayley. — Il apparaît donc que les matrices unitaires 
et les matrices hermitiennes ont des propriétés voisines. Cela s’explique 
par la relation de Cayley . 

Les valeurs caractéristiques d’un opérateur hermitien sont situées sur 
l’axe réel, tandis que celles d’un opérateur unitaire sont situées sur le 
cercle unitaire. Or on passe de l’axe réel au cercle unité par la transfor- 
mation 

__ x -h /’ 

~ ~ x — / 

Nous allons donc essayer de former 


H désignant un opérateur hermitien et nous chercherons à vérifier que L 
est alors un opérateur unitaire. Mais nous ne connaissons pas la division 
des matrices; par conséquent nous formerons 

(H-hi)fH — O” 1 - 

Pour faire la démonstration nous allons choisir des axes de coordonnées 
par rapport auxquels H prendra la matrice réduite 

H = || hj S;, II, 

les hj étant tous réels, puisque H est hermitien. Nous aurons alors 

H i = || ( hj -h i) 8/*||, 

H — i — \\(hj — /) Sjk[\. 

Cette dernière matrice, n’ayant pas de valeur caractéristique nulle, 
présente une inverse 

(H = 

Le produit 

U =(H + /)(H — z’)- 1 

est donc commutatif, puisque formé à l’aide de deux matrices diagonales 
et à pour expression 
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La matrice U est donc diagonale et a ses valeurs caractéristiques 
de module i ; elle est donc unitaire. 



En résumé, si la matrice H est hermitienne , la matrice 
U=(H-hï)(H — i)r+ 

est unitaire . 

Réciproquement, la relation liant H et U peut se résoudre en H et 
s’écrire 


Nous allons montrer que si U est une matrice unitaire, cette relation 
définit une matrice H hermitienne. En effet, nous pouvons prendre LJ 
sous forme réduite 


U = || lj o/x || avec j À/ j = i quel que soit j. 


Nous aurons alors 

Ü + I =||(À/4-i) «/* ||, 
ü — I =||(X/ — I) * M ||, 



Or lj étant sur le cercle unité, le nombre a pour argument — 


donc 


X,-. 


^ est réel. Il en résulte que l’opérateur II, dont la matrice se 

réduit à la forme diagonale, et dont les valeurs caractéristiques sont 
réelles est un opérateur hermitien. 

Donc, les opérateurs unitaires et hermitiens se correspondent biuni- 



1*4 

voqueraent par les relations 
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ü = 


« -+-/ 

H — i* 


H 


.U-+-I 


Ceci exprime le parallélisme entre les propriétés des opérateurs uni- 
taires et hermitiens. Cette relation, introduite pour la première fois par 
Cayley, a été très utilisée par vôn Neumann; il l’a généralisée à l’espace 
de Hilbert, et cela lui a permis de traiter certains opérateurs hermitiens 
non bornés en les ramenant à *dés opérateurs unitaires bornés. 

On doit à Frobènius l’extension suivante : 


Si A est un opérateur normal non dégénéré, A*A -1 est un opérateur 
unitaire. 

Cette propriété se vérifie immédiatement en prenant la matrice A sous 
forme réduite 

A = I|X, *,* ||; 

dans ces conditions 

A* = || h Su fl, 


et alors 


A - 1 = 


A* A - 1 = 


°ik 


%ik 


Nous reconnaissons la forme diagonale de l’opérateur unitaire dont les 
valeurs caractéristiques ont i pour module. 


3. Les opérateurs unitaires infinitésimaux. — Imaginons une rota- 
tion du corps des vecteurs. Dans le temps dt cette rotation transforme 

le vecteur X en le vecteur X -j- dX. et nous avons = CX, C désignant 

une matrice ou un opérateur. Par abréviation nous dirons que C est un 
opérateur unitaire infinitésimal. Dans la transformation, les longueurs 


sont conservées; autrement ditX*X = ILxiXi est un invariant. Cela exige 
que 


i dfCt 
I dt 


V 1 - dxt 


or, nous avons 


dxi 

~di 


= 7 t CikXk. 
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La condition précédente peut donc s’écrire 

2 X i^ à %k -+*2 X i 2 CikXk = °* 

i k i k 


Soit encore, en changeant le nom des indices 

2 ( Cik -+- Ckt) X t Xk = O. 
i,k 


Le premier membre de cette relation doit être nul quel que soit le 
vecteur X de composantes x K , x n ; pour cela il faut et il suffit 

que 

Cik ■+■ Cki = O 


ou 

G* = — C; 


la matrice C doit présenter la symétrie hermitienne gauche . Elle n’est 

G 

pas hermitienne, mais la matrice H — y l’est. Nous aurons donc 


dX. 

dt 


flIX. 


Si la matrice H est constante et indépendante du temps , nous en 
déduirons 


X(0 = c ,<H 'X(o), 


la matrice U(£) = e m étant unitaire, d’après son sens géométrique, et 
satisfaisant à la relation 

V(ti ■+- t t ) = U(/,) 


Si la matrice H n’est pas constante, nous effectuerons l’intégration de 
la relation différentielle par la méthode des approximations successives, 
en utilisant la forme 

X(0 = X(o)-h f G (t)X(t)dt. 
do 

Nous aurons 

Xo (0 = X(o), 

Xi (0-X(o) + r C(OXo (t)dt, 

X 2 (0 = X(o) + f C(0Xi(0*, 
d 0 

J 

X*+i(0 = X(o)-t- / G (t)Xk(t)dt } 
d 0 
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Ce qui peut s'écrire 

X«(/)= X(o), 

X,(f) = X(o)-t-X(o) f * C(<, )dh, 

X ï ( 0 =X(o)-+-X(o) / C(ti)dti^X{o) / 

*' f t — 0 /,=0 *'/ 1 = 0 

/■'»=* r '»=* r 'i='« 

X s (f)sX(o) + X(o) j G(ti)dti -+- X(o) / / C(f 4 )C(fi)tffn 

d f i ~0 d t x — 0 ^/,= 0 

= < ~h — ts ph—h 

+ X(o )/ / / G( £3) G( ti) G(/i) cfti ^2 

•^/, = 0 d/^ — Q d ti — 0 


et en posant 

u *(0 = //■/ G( <* ) C( /A_| ) . . . C( ) C( <t ) rfti <* t . . . dtk 

(O 

nous aurons, pour terme général, 

il 

X„(<)= X( o)2 Ua(<). 

, ^ — 0 

Etant donné que 

U*+i( 0 = f C(l)Vt(t)dt, 
d 0 

il est facile de s’assurer que la fonction 

X(0 = limX,»(0 = X(o)V Ujfc(f), 

n=» 

k - 0 

est bien solution du problème si la série 2 U* est absolument et unifor- 
mément convergente dans l’intervalle où l’on opère, car il est alors 
possible de l’intégrer terme à terme. En particulier, si dans cet inter- 
valle nous avons | C (t) | < c, il en résulte par un calcul très facile ( voir 

métrique de Frobénius, Chap. II) que | U*(£) | < et, par consé- 
quent que la série 2 U* est absolument et uniformément convergente 
dans un intervalle fini quelconque. Notons que si 

OC 

U(() = U((,«)=^U,(0, 

* = 0 


on ja 


X(* 2 )“- U(f 4 , ), 

,U(^8î * 1) = h) U(* 2) ^i)* 
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4. Composantes hermitiennes d’one matrice quelconque. — Soient A 
une matrice quelconque et A* son associée. Envisageons la matrice 
B = A-f-A*; nous avons B* = A* -f-À = B ; la matrice B est donc 
hermitienne. Envisageons de même la matrice C = A— Â*; nous 
avons C* = A* — A = — G = i 3 C ; il en résulte que ( i'C)‘ — «G, donc 

G 

que la matrice i C est hermitienne ainsi que — iC— Posons 

A -v- A* = 2 Ai, 

A — A* = 21 Aj, 

les matrices A* et A 2 sont hermitiennes et parfaitement déterminées et 
nous déduisons de ces deux relations 

A = A j - 4 - i Aî, 

A* = Ai — i A 2 . 

Les matrices et À 2 sont dites les composantes hermitiennes (uniques) 
de la matrice A; elles sont à rapprocher des composantes réelle et 
imaginaire d’un nombre complexe, ainsi qu’il apparaît par la considéra- 
tion de la forme associée à la matrice A. 

X*AX = X*A 1 X-hiX*A 2 X, 

les formes associées à A| cl A 2 sont donc les composantes réelle et 
imaginaire de la forme associée à A, car les deux formes hermitiennes 
X*A|X et X*A 2 X sont réelles. 

Démontrons maintenant que la condition nécessaire et suffisante pour 
qu’une matrice soit normale est que ses composantes hermitiennes 
soient permutables. En effet 

AA* = A ^ -+- i A 2 A i — t A i A 2 -H A j , 

A* A = A j’ -+- i*A] A-> — i A 2 Ai -+- Aj. 

Si nous exprimons que AA* = A* A, il vient immédiatement 

AiA* = AjAi. 


III. - QUELQUES COMPLÉMENTS. 

1. Loi d’inertie. — La réduction d’une forme d’Hermite en une 
somme de normes 

A(X,X)=2«E«(X,X) r« = V», >•<*>, VP)-, Ei_(X, X) = (E/X, E,X)] 
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peut être. obtenue sans changement de coordonnées normales (mais 
avec des coordonnées obliques) par application du théorème classique 
de la décomposition en carrés des formes d’Hermite (et des formes 
quadratiques réelles). 

Si une norme est affectée d’un coefficient positif, on peut faire entrer 
celui-ci dans la norme et n’avoir plus que le coefficient 4-1. Si une 
norme est affectée d’un coefficient négatif, on peut faire entrer la valeur 
absolue de celui-ci dans la norme et n’avoir plus que le coefficient — 1 . 
De telle sorte qu’une réduction de la forme d’Hermite H(X, X) se présen- 
tera sous la forme 

H(X, X) = 3 ^ 2 / 2 -H. • • + y r y r —yr+\yr+l — Jv+S/ZH-S — ••• — ynyn. 

Elle comprendra r signes 4- et n — r signes — . Nous allons démontrer 
que, quelle que soit la décomposition de la forme d’Hermite, elle présen- 
tera toujours le même nombre de signes 4- et de signes — ; ce théorème 
correspond à la propriété bien connue de Sylvester pour les formes qua- 
dratiques réelles. Soit donc une autre décomposition 

11 ( Nj X) = Z\ Z\ - 4 - £o Z% -H . . . -+- Z s Z s — £$-t-t £$-f-l — £$-4- 2 • • • Zn Znj 

les z étant, de même que les y, des formes linéaires en x . Prouvons que 
nous avons nécessairement r = s . En effet 

r n s n 

n(x, X) =2 1/( l ! — 2 l ! =2 1 z ‘ I 2 — 2 1 Zi |2 ’ 

1 r>+- 1 1 s-h l 

Soit 

r n s n 

2 ^ |S = 2 * Zi I* 

1 s-M 1 r-h i 

Or si nous supposons que r < s , il en résulte que le premier membre 
est la somme de r 4- n — s < n carrés; d’après la théorie des équations 
linéaires, il existe donc une solution non nulle au moins qui annule le 
premier membre en satisfaisant aux équations 

fi = 0 , fi = 0 , = 

£$-4-1 = Oj £5+2 — °? •••? Zn = O. 

Cette solution annule donc aussi le second membre; et puisque celui-ci 
se présente sous forme d’une somme de carrés, elle annule chaque terme, 
son 

y r-h 1 = °) y r-4-2 =* O f . . . , y n = O, 

£l 2=8 0, £j — 0, . . . j £$ = O. 



ÉTUDE PARTICULIÈRE DES MATRICES ET OPÉRATEURS HERMITIENS. 189 

Il existerait donc une solution non nullé qui annulerait simultanément 
toutes les formes linéaires y; ; or ceci est impossible puisque ces formes 
sont au nombre de n , dépendent de n variables et sont linéairement 
indépendantes. Nous ne pouvons donc avoir r pour la même rai- 
son, nous ne pouvons avoir r > s; donc r = s. 

2. Remarques relatives à la résolvante d’Hilbert. — La matrice 
hermitienne H a pour résolvante d’Hilbert 

R = (1 — H- H )— 1 — 1 
H* 

Si nous effectuons dans le changement unitaire de variables 

X = UY, xi uayk, 

k 

qui permet de passer de H(X, X) à sa forme réduite K(Y, Y), nous 
obtenons 

( 1— ;jl K ) _1 — 1 # 

jï ' 

c’est-à-dire la résolvante de K (Y, Y). 

Si, d’après les notations de Hilbert, nous posons p p — ~ en désignant 

par les valeurs caractéristiques de la matrice hermitienne, nous 
voyons que la forme associée à 1 — p.K est 
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Et il nous* est maintenant facile de revenir aux premières variables. La 
réduction est, en effet, obtenue par le changement unitaire de 
variables 

Y = IMX = U*X, 

soit, en explicitant, 

n 

y p =^ à ü tp cc i = »), 

i - 1 


d’où la forme résolvante de H(X, X) sous l’expression remarquable 
d’une décomposition en carrés 


X'RjjlX =2 
/' = ] 


U\pX \ -h Utp X'i •+• . . . -4- Un p JC, , 


H- p — ,u. 



CHAPITRE V. 

VALEURS D’UNE FORME ASSOCIÉE A UN OPÉRATEUR. LIEN AVEC LA 
RÉDUCTION CANONIQUE D’UNE FORME HERMITIENNE (MÉTHODE 
D’EXTREMUM POUR LA RÉDUCTION). DOMAINE DES VALEURS D’UNE 
FORME ASSOCIÉE A UN OPÉRATEUR QUELCONQUE. 


I. — MÉTHODE D’EXTREMUM POUR LA RÉDUCTION 
DES FORMES D’HERMITE. 

1. Les méthodes d’extremum pour rétablissement de théorèmes 
d’existence ont une grande simplicité; elles sont d’ailleurs fort anciennes 
puisqu’elles ont été utilisées par Legendre, Lagrange, Gauss, Dirichlel, 
Riemann, Hilbert, etc. Elles ont été appliquées systématiquement par 
Courant dans ses recherches relatives aux problèmes de physique mathé- 
matique. 

Ici la base de la méthode est le lemme de Bol zano-Weier strass dont 
on tire comme conséquence que : toute fonction réelle continue de K 
variables réelles dans un domaine borné et fermé est uniformément 
continue, donc elle est bornée , donc elle a un rrtaximum; elle atteint 
effectivement ce maximum , pour un point au moins, du domaine des 
variables ou de sa frontière. 

Ces propriétés classiques étant rappelées, nous allons donner le 
premier état de la méthode . 

Envisageons la forme d’Hermite 

H(X, X) = X*HX te Zhtkxtxk 

et nous allons considérer les valeurs prises par la forme H, lorsque X 
est un vecteur quelconque satisfaisant à|X| 2 = i. Le domaine de 
variation des xi est borné et fermé. H(X, X) est fonction réelle et con- 
tinue des Xi dans ce domaine. La fonction H présente donc un maximum t 
atteint pour X = e it Considérons alors les vecteurs X do longueurs i 
orthogonaux à e K , c’est-à dire tels que (£<,X) = o; les variables X 
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3 ècrivent encore un domaine borné et fermé dans lequel la fonction H 
atteint son maximum X a <X, pour X = e 2 . Puis nous considérerons les vec- 
teurs X orthogonaux à e\ et à e 2 ; ils décrivent encore un domaine borné 
et fermé dans lequel la fonction H atteint son maximum X 3 <X 3 pour 
X = e 3 , . .., et ainsi de suite. Les valeurs X,- sont réelles comme les 
valeurs de H(X, X). 

Nous avons ainsi mis en évidence un système orthonormal de vec- 
teurs e\, e 2l . . . , e H . Formons maintenant la matrice XJ dans laquelle les 
éléments d’une colonne sont les composantes de Pun de ces vecteurs, 
soit 

U = ! C’i ... €n Q , 

et effectuons le changement de variables défini par 

X = UY, 

ce qui revient à prendre pour nouveaux vecteurs coordonnés les vec- 
teurs de e t , e 2j . . . , e n . La forme deviendra, en nouvelles variables, 

Y* U* H U Y = Y* K Y = K (Y, Y, *»/><//> 

il 

c’est la forme associée à la matrice transformée. Montrons que c’est la 
forme canonique diagonale. 

En effet, elle est maxima pour X = e,, c’est-à-dire pour Y (,) de coor- 
données nouvelles (i, o, o, . . o), et a pour valeur X,. Donc k n =X,. Pour 
tous les vecteurs y\~ o (orthogonaux à e h ) elle est maxima pour X = c 2 , 
c’est-à-dire pour Y (2 > de coordonnées nouvelles (o, i, o, o, . . . , o), et a 
pour valeur X 3 , et ainsi de suite. 

Posons 

K ( Y, Y) = 1 kijÿtfj = \Cyxyi 


et formons la différence, 


K(Y,Y)-X,(^ ri + ÿ^ + --- + r»r») = K *(Y, Y). 


L’expression R|( Y, Y) ne contient plus de terme y\J\ ; d’autre part, 
elle est toujours négative ou nulle puisqu’elle l’est d’après la définition 
même de X, , lorsque | Y | = i . Montrons que K 1 ( Y, Y) ne contient pas la 
variable y K ; pour cela, faisons 


. = 7 * = °î 


= y 3 = 7.4 = 
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l’expression se réduit alors à 


Ki (Y, Y) = <xi 2 e -h a 2i e-h a 2i e£ (a*i = a i2 et a 22 réel ). 


Si e est réel, la partie principale est 

(ai-i-t- ** i)s 

et change de signe lorsque e change de signe*; l’hypothèse que (Y, Y) 
est toujours négative entraîne donc 

oc 1 2 -+” 0t 2 i — O, 

Si s est imaginaire pure e = ls f , la partie principale est 

(«la— *it)e 

et change de signe lorsque e 9 change de signe (ne pas oublier que 
— a 2 i est imaginaire pur); l’hypothèse que K f (Y, Y) est toujours 
négative entraîne donc a* 2 — a 2i = o. 

Nous avons donc nécessairement 


a i2 — «2i = o; 

autrement dit il n’y a pas de termes y\y± niy^y^. Ilest clair que la même 
démonstration nous permet d’affirmer qu’il n’y a pas non plus de 
termes xi J3 ni y 3 y l: ...,yiy n ni y n y it 
Finalement nous voyons que K 4 (Y, Y) ne contient que les variables 
y y, . . . ,y n ; il en est évidemment de même de l’expression 

K(Y, Y) — Xiy t yi ; 
car 

K(Y, Y) — XiXi.Xi= K i(Y, Y) + + y n yn ), 

que nous désignerons dorénavant par K* ( Y, Y) pour ne pas compliquer 
les notations. Nous avons donc obtenu une forme 

Ki (Y, Y) = K (Y, Y) — XiÿiXi 

hermitienne et ne contenant que les variables y 2 , . ... y n ; lorsque l’on 
fait ^ = o, il est clair que la forme K se réduit à la forme K^; or nous 
savons que, dans ces conditions, elle présente un maximum X 2 obtenu 
pour X =s e 2 , c’est-à-dire Y< 2) (o, î, o, o, . . .. o); il en est donc de même 
de la forme K, sur laquelle le raisonnement précédent s’applique; nous 
obtenons donc une forme 

K*(Y, Y) — Ki (Y, Y) — 


1ULIA 


13 
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hermitienne et ne contenant que les variables . . . , y n . Et nous pou- 
vons ainsi continuer jusqu’à épuisement de toutes les variables; finale- 
ment nous voyons que la transformation X == U Y a ramené la forme 
hermitienne à son expression canonique 

n 

H(X,X)=K(Y,Y)= 2 W<- 

i- 5 

Cette méthode de recherche de la forme canonique nous a permis de 
donner une définition intéressante des valeurs caractéristiques suc- 
cessives 

Xi >x 2 ;>x 3 g...^x„. 

Nous aurions pu rechercher les minima successifs au lieu des maxima 
successifs et obtenir les valeurs caractéristiques en commençant par la 
dernière; nous aurions été amené à faire les mêmes raisonnements. 

Nous pouvions présenter la question d’une façon un peu différente. Il 
suffit, pour cela, de remarquer qu’il revient au même de rechercher les 
maxima successifs de H(X, X) lorsque |X| = 1 ou de rechercher les 

maxima successifs de sans * m P oser à |X| de condition; ou bien 

encore de rechercher les minima successifs de (X, X) lorsque 
H(X ? X) = i; c’est là le second aspect que nous voulions donner au 
problème. Nous chercherons donc le minimum de (X, X) lorsque 

H(X, X) = i; c’est — atteint pour X = c<. Puis nous chercherons le 
le minimum de (X, X) lorsque, de plus, nous nous imposons la condi- 
tion X) = o ; c’est y atteint pour X = c 2 , etc. Cette seconde façon 

de procéder peut être interprétée géométriquement, carH(X, X) = 1 est 
l’équation d’une quadrique centrée à l’origine; nous cherchons donc sur 
la quadrique des points dont la distance au centre est minimum. 

Les deux manières précédentes d’aborder la question : maximum 
de H sur (X, X) = 1 , ou minimum de (X, X) sur H(X, X) = 1 , sont 
classiques en calcul des variations et correspondent à la dualité des 
problèmes d } extremum lié. 

2 . Montrons que les X, ainsi obtenus (maxima successifs de H) ne sont 
autres que les valeurs propres de la forme H. 

En effet, les X; sont les racines de l’équation 

(X — Xi ) ( X — Xj ) . . . ( X — X n ) = o, 
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soit 


X — Xj o ... 0 

o X — X 2 ... 0 

o o . . . X — X A 


Le premier membre est le déterminant de la forme 

/i n 

~2 = m Y, Y) - K( Y, Y). 

p-i p - 1 

Or, ncuis savons que cette forme provient de 
XE(X, X ) — H ( X, X), 

par le changement de variables 

X = UY. 

Il en résulte que le déterminant de XE( Y, Y) — C(Y, Y) est égal au déter- 
minant de XE(X, X) — H(X, X); autrement dit, les h sont les racines 
de l'équation 

I tôik—aa | = O, 

qui est l' équation caractéristique de H. Les X; sont donc les valeurs 
propres de H. Ce sont des nombres réels égaux aux inverses des carrés 
des longueurs des demi-axes de la quadrique à centre d 1 équation 

II = 1. 

La forme H est définie positive dans le cas où tous les X,- sont positifs, 
et dans ce cas seulement. Elle ne’ dégénère que si un X; au moins est nul. 

Les valeurs^* apparaissent bien comme des valeurs privilègiées de la 
forme H, ce qui justifie la dénomination d e valeurs propres ou valeurs 
caractéristiques de H. 

Les itérées de H s'obtiennent immédiatement sur la forme réduite. 

Si 

H 

H(X,X) = K(Y, Y)=2>‘/W>, 

i 

on aura 

n 

H'(X, X) = K'(Y, Yj=2MJ^ 


et l'on voit que les H 2m sont toutes définies positives si H n'est pas 
dégénérée. 
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3 . La méthode que nous venons d’exposer a un très grave défaut. h»è 
premier maximum X, se déduit directement de la donnée de la forme ; 
mais le second exige la détermination du premier, le troisième exige la 
détermination des deux premiers. En sorte que les X,- ne se déterminent 
pets individuellement et indépendamment , mais successivement . 
Aussi Fischer ( 1 ) a-t-il donné un deuxième état de la méthode appelé : 
méthode des plus petits maxima dans lequel les X peuvent être déter- 
minés indèpendemment les uns des autres . Courant a repris et consi- 
dérablement développé l’idée de Fischer. 

Considérons la forme hermitienne 

A(X, X) — 'La ik x i x k 

et cherchons son maximum lorsque le vecteur X a une longueur égale 
à 1 et lorsqu’il est assujetti en outre à h — 1 équations linéaires 

n 

(l) 2 a P'/ a V == ° P 0ur /> = I, 2 . 

7=1 

Lorsque X balaie ce domaine borné et fermé, la forme h. présente un 
maximum JTL/, ( a pq ) qui est fonction des coefficients constants <x pq 
déterminant le domaine. Si nous donnons à ces coefficients toutes les 
valeurs possibles , OU h a un minimum; nous allons prouver que c'est 
la h lème valeur caractéristique X/ e . 

A cet effet, nous allons utiliser la forme canonique 

A(X, X) = K( Y, Y ) = ..-h X,,/,,^,,. 

Avec les variables^, les h équations linéaires deviennent 

O) Zj 0 pour p = 1, 2, .... h — 1, 

7=1 

Choisissons alors, en particulier, 

7/1+1 = yh+n. = o. 

Les h — 1 équations homogènes et linéaires, qui comprennent encore h 
inconnues y { , . . . . y h, présentent, au moins, une solution non nulle et 
définie seulement à un paramètre multiplicatif près; nous pouvons déter- 
miner celui-ci de façon que le vecteur solution ait une longueur égale à 


( l ) E. Fischer, Moncitshefte fiir Math, und Phys., i^oô. 
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l'imité. Pour cette solution nous aurons 

K (Y, Y) = \ t y t y* -h \h'yhyh Z X/, [ji/i h- yuyh\ 

Or le vecteur solution ayant une longueur unité, il en résulte que 
y\ yi -+* ytyi -h . . . ■+• yuy/i = 1 , car les y/,+* — o, 

donc 

K(Y, Y) X/ t . 


Par conséquent le maximum de K (Y, Y) est supérieur ou égal à X/i, quel 
que soit le choix des (3 ; donc le maximum de A (X, X) est supérieur ou 
égal à X^, quel que soit le choix des a. 

Or choisissons les valeurs de a dans (1) ou celles de (3 dans les 
équations (2), de telle sorte que les équations (2) se réduisent à 

y j = o, y *5 = o, . 1 = 0 (linéairement indépendantes); 


la forme se réduira alors à 

K(Y, Y)= ^hÿhy/i -h X* + iy A+ iy A+ i -h ... -h X„y„y„g X*[y A y/ f -+-... +/«/«]. 


Elle atteindra son maximum X* lorsque 

r/t^i = yh+i = ••■—=/* = o. 

Le nombre X4 donc an maximum et c y est le plus petit des 
maxima . Le théorème est donc établi. 


0 /t choisir les <x de façon que le maximum de A(X, X) atteigne 
sa plus petite valeur l p . 

En résumé, si les valeurs propres de A sont rangées par ordre non 
croissant : X,>X 2 >. . .>X„, la h ième valeur propre X* est la plus 
petite valeur que peut prendre le maximum de A(X, X) lorsque X ; 
satisfaisant à | X | = 1, est en outre assujetti à vérifier h — 1 équa- 
tions linéaires arbitraires. Cette plus petite valeur X^ est atteinte 
lorsque ces h — 1 équations linéaires sont convenablement choisies 
(elles sont alors indépendantes) : si X = UY (donc Y = U~‘ X = U*X) 
exprime la transformation unitaire réductrice de A(X, X), les h — 1 
équations précédentes s’expriment par y* = o, .... yn-\ = o, où les yi 
sont les formes linéaires en x données par Y = LMX = U*X. 


4 . De cette deuxième méthode nous pourrions aussi déduire une 
méthode corrélative en fixant la valeur de la forme et en cherchant le 
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minimum de la longueur du vecteur. Donnons simplement un exemple. 
Soit un ellipsoïde et plaçons-nous dans le domaine réel 

H(X, X) = 'Za i kX t Xk— i. 

Désignons par £* les cosinus directeurs de la direction X; nous aurons 
alors, pour i = i , 2, 

*f=PÊ/ avec 2 Ç?=i, 

donc 

p*ïa^Ç<Çjfc= 1. 

Soit 

P M(Ç, O 

p représente la longueur du vecteur rfo/ii V extrémité décrit V ellipsoïde. 

Le carré du demi petit axe de l’ellipsoïde est l’inverse du maximum 
de H(£, £) lorsque le vecteur \ a pour longueur 1 , soit 

P? = (ici h 1 ). 

Imposons-nous maintenant une relation linéaire 
2 “*^“° (ici h = 2), 

i 

nous obtenons une section diamétrale. Cherchons alors le maximum de 
son petit axe : c’est l’axe moyen de l’ellipsoïde. Or le carré du demi 
petit axe de. la section est l’inverse du maximum de H(£, £) sur la 
section; la plus petite valeur de ces maxima est donc le carré du demi- 

axe moyen de l’ellipsoïde p* == ~ • 

Enfin, imposons-nous deux relations linéaires (A = 3 ); nous obtenons 
une direction et cherchons le maximum de la longueur découpée par 
l’ellipsoïde sur cette direction : c’est le grand axe de l’ellipsoïde. Il a un 
carré égal à l’inverse du minimum de H(£, £) lorsque le vecteur \ a pour 
longueur 1, soit 



5 . Applications. — Cette définition des valeurs caractéristiques par 
les plus petits maxima est très importante. Elle permet d’étudier direc- 
tement les valeurs propres sans passer par le système algébrique 
ÀX = XX qui les introduit en bloc sans en bien montrer les différences. 
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En particulier, cette méthode va nous permettre de résoudre très faci- 
lement le problème- suivant : 

Considérons la forme 

i,k 

et supposons que le vecteur X soit non seulement assujetti à rester sur 
la sphère | X | = 1 mais, de plus, à satisfaire à p relations linéaires 
indépendantes 

n 

(3) o pour m = 1 , 2 , .... p. 

<7=1 

La forme H de n variables indépendantes devient donc une forme 3C ne 
dépendant plus que de n — p variables indépendantes seulement. 
Nous nous proposons de chercher les valeurs caractéristiques À de 
cette nouvelle forme. 

La A lèrae valeur propre A* de est le plus petit maximum de 3Z 
lorsque nous ajoutons h — 1 relations linéaires arbitraires, c’est-à-dire le 
plus petit maximum de H lorsqu’il y a p -h h relations linéaires dont h 
sont arbitraires, les p premières étant (3). Si toutes les relations étaient 
arbitraires, nous aurions un champ plus étendu de maxima et \,+h, 
qui en est le plus petit, satisfait donc à 

^p+h ^ A/*. 

Si nous n’avions que les h relations arbitraires et si les autres relations (3) 
n’existaient pas, chaque maximum se trouverait augmenté et il en serait 
de même de leur borne inférieure À* qui est devenue donc 

A h $ X*. 

Finalement, nous avons encadré les nouvelles valeurs caractéristiques 

l'p+h ^ A h ^ X/j. 

Si, dans une forme d'Hermile H à n variables , on impose p rela- 
tions indépendantes linéaires et homogènes de liaison à ces variables , 
elle devient une forme d'Hermite 3Z à n — p variables . Les valeurs 
caractéristiques À de satisfont aux inégalités suivantes : 


Xi > x 2 

>. 

■ -vi?-'” 

VII “ VII 


A, A 2 


• = An-/?, 
VII 

VII “ VII 




X/i, 


où les X sont les valeurs caractéristiques de H. 
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En particulier , si nous prenons x n = 0 comme équation de liaison (3), 
la forme d’Hermi te H se réduit à sa (n — i) ,ème section. La A lôino valeur 
propre de la ( n — i) lème section de H est comprise entre la /i lèrac valeur 
propre de H et la {h 4- i) l6me . Et le même théorème est applicable de 
proche en proche pour les sections de tous les ordres de telle sorte que : 

les valeurs caractéristiques de la(n — i) ième section séparent celles 
de H; 

les valeurs caractéristiques de la {n — z) ième section séparent 
celles de la (n — i ) ième ; 

les valeurs caractéristiques de la (n — 3 ) ième section séparent celles 
de la {n — 2) ième ; 

et ainsi de suite. Nous obtenons donc ici un théorème analogue au théo- 
rème de Rolle pour la distribution des zéros des dérivées successives 
d’une fonction. 

Comme autre application , remarquons que si à une forme d’Her- 
mite H(X, X) on ajoute une forme d’Hermite H 4 (X, X) non négative, 
les valeurs propres de H -{- H 4 seront supérieures ou égales aux valeurs 
propres correspondantes de H. 

Pour les applications immédiates à la mécanique des petites oscilla- 
tions on pourra consulter l’article de Courant intitulé Zur Théorie der 
Kleinen Schwingungen dans Zeitschrift für angew. Math . und 
Mech ., 1922, BD 2 , S, 278-280. 


II. — ÉTUDE PARTICULIÈRE DU DOMAINE DES VALEURS 
D’UNE FORME ASSOCIÉE A UN OPÉRATEUR QUELCONQUE. 


1 . A un opérateur A quelconque de matrice || a** |, nous associons la 
forme 


A(X, X) = X*A X=sïai*ïi**. 


Nous allons étudier le domaine V(A) du plan complexe parcouru par 
le point A(X, X) lorsque le vecteur X décrit la sphère 2 , | X | = 1, ou 
2 | Xi\ 2 z= 1. Le domaine de la variable X étant borné et fermé, la fonc- 
tion A(X, X) étant continue, son module présente un maximum M(A), 
atteint en un point au moins du domaine et nous avons 

I X*AX i < M( A). 

Faisons maintenant une remarque essentielle pour la suite : 
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Si nous effectuons sur X une substitution unitaire quelconque définie 
par X = UY, la forme devient 

X*AX = Y* U* AU Y 


et la variable Y, de même que la variable X, décrit le domaine | Y | =. i. 
Il en résulte que le domaine V(A) est le même pour A et pour 
U* AU = U~‘ AU; le domaine est invariant lorsqu’on effectue une 
transformation unitaire sur la matrice. Ce qui va nous permettre, dans 
l’étude qui va suivre, de remplacer une matrice par sa forme cano- 
nique dans le groupe unitaire. 


Cas d'un opérateur hermitien. — En le ramenant à sa forme cano- 
nique diagonale, nous avons déjà vu que le domaine d’un opérateur 
hermitien est le segment réel (X, A) compris entre la plus petite et la 
plus grande de ses valeurs propres. 


Conséquence. 

avons 


Si une forme d'Hermite A est non négative , nous 


'ZatkXiXk'ÏO' 


En faisant Xi=i et toutes les autres variables nulles, nous obtenons 



En annulant toutes les variables, sauf x- t et x *, nous obtenons 

auXiXi -h atkXiXh -+- aki Xi Xk 4 - akk Xk x^o. 


Ceci exprime que la matrice hermitienne 

i au a lk II 

aki a k k I 


est non négative, c’est-à-dire que ses valeurs propres sont non néga- 
tives, donc que son déterminant est positif ou nul; nous obtenons ainsi 
une autre relation 

aaakkZ a ik a ki= I «u- 1 4 . 


Cas d'un opérateur normal . — Nous le ramenons aussi à sa forme 
canonique XjXj, dans laquelle les sont des nombres complexes 

t 

quelconques. Le problème consiste donc à chercher le domaine balajé 
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par l'expression SX; a/ lorsque les nombres a/, tous positifs, satisfont 
d'autre part à la condition i ; autrement dit, à chercher le domaine 
balayé par le centre de gravité du système des points X* affectés de masses 
positives arbitraires. Nous savons que l'on démontre par récurrence, à 
partir de deux points X,:, que ce domaine est le plus petit polÿgone con- 
vexe contenant tous les points h(')> les sommets du polygone sont 
nécessairement des -valeurs caractéristiques, mais le polynôme peut 
contenir à son intérieur d'autres valeurs caractéristiques. 

En particulier si V opérateur est unitaire , ses valeurs caractéristiques 
sont situées sur le cercle unité et le domaine est donc un polygone 
convexe inscrit dans le cercle unité et dont les sommets sont les 
valeurs caractéristiques. Il en résulte que les valeurs prises par la 
forme ont toutes un module inférieur ou égal à i . 

2. Cas général. — Les valeurs caractéristiques ne suffisant pas, dans 
le cas général, à déterminer la forme ( 2 ), nous pouvons prévoir comme 
probable que ces mêmes valeurs caractéristiques ne suffiront pas à 
déterminer le domaine comme dans les cas précédents. Nous allons, 
malgré cela, obtenir sur lui quelques renseignements. 

Théorème de Hausdorff-Tœplitz. — Tœplitz a démontré que la 
frontière de V(A) est une courbe convexe ; Hausdorff a démontré 
que V(A) lui-même est tout V intérieur de cette courbe convexe. 

En effet, la forme A peut être décomposée en ses deux composantes 
hermitiennes 

A — A. i -h i A *2 . 

Nous pouvons toujours supposer, par une transformation unitaire [qui, 
nous l'avons déjà vu, n'altère pas le domaine V(A)], avoir ramené la 
forme A* a son expression canonique 

A(X, X) = At(X, X) •+• t A 2 (X, X). 

Le point A^X, X), décrit le segment (X, A) de l'axe réel, d'après l'étude 
des formes hermitiennes. Considérons alors un nombre réel a u compris 
entre X et A; il existe un ensemble de points de 2(|X|=i) pour 
lesquels A a (X, X) = a K , montrons que cet ensemble est connexe , c'est- 
à-dire que deux points quelconques de cet ensemble peuvent être joints 
par un chemin dont tous les points appartiennent à l'ensemble. 


( l ) Voir par exemple Garatheodoby, Rendiconti del Circolo Math. di Palermo t igu. 
(*) Elles suffisent pour un opérateur normal. 
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Soient donc deux points delà sphère 2(|X | = i) : 

Y de coordonnées y K y ai . . . , y n avec yi= \yi | e^ t 
Z de coordonnées z , , z a , . . . , z n avec zi — | Z[ | 

satisfaisant à A, (Y, Y) = k K (Z, Z) = a { . Or 
A,(X,X)=2]Wr <; 

i 

les deux conditions précédentes s’écrivent donc 

i 

l*i !* = «>• 


Fig. 6. 



Envisageons maintenant les trois courbes suivantes définies par le para- 
mètre réel t variant de o à i : 

i° La courbe C*, décrite par le point X (, î tel que == \yi | 

2 ° La courbe C 2 , décrite par le point X< 2) tel que 

4 a) = s/^=W7^ÏWt I 1 ; 

3° La courbe C 3 , décrite par le point X (3 ) tel que x^ ] = | zi | e e ^, 

La courbe C*, dont le point courant a des cordonnées de module 
constant, satisfaisant à | X | a = | Y | a = i, joint le point Y au point de 
coordonnées \yt |. 

La courbe C 2 , dont le point courant a des coordonnées réelles, satisfait 
bien elle aussi à l’équation de la sphère | X j 2 = i ; elle joint le point de 
coordonnées \yt | à celui de coordonnées ) Zi |. 
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La courbe C 3 , dont le point courant a des coordonnées de module 
constant, satisfait à l’équation de la sphère | X| 2 = i; elle joint le point 
de coordonnées | Zi | au point Z. Donc la courbe C, 4- C 2 -f- C 3 joint Y 
et Z sur la sphère 2. 

Il nous reste à vérifier que le long de ces trois courbes, nous avons la 
relation A ,(X, X) = a,, pour avoir démontré que le domaine des 
points X de la sphère tels que A,(X, X) — a, est connexe. Or ceci est 
immédiat : 

A, (XM, X«») = 2 ^'i' 1 *1* : 1 =2 I rt I 1 = A * ( Y ’ Y ) = ai - 

i i 

i 

= (i-<>2 X ( |y i r-+«2x i |3 1 |» = (i-«)A 1 (Y,Y) + <A 1 (Z,Z) = «,, 

i i 

A,(X<»),Xt»))=2 X/ 1 *i 31 P-2 Xi I *' I* = a '- 

i i 

Le domaine des points X envisagés est donc connexe; d’autre part, 
il est fermé puisque la fonction A, (X, X) qui sert à le définir est continue, 
et il est borné puisque |X | = i. La forme A 2 (X, X) étant continue et 
réelle prend dans ce domaine toutes les valeurs comprises entre un 
minimum a 2 et un maximum a 2 (qui peuvent être confondus). Donc, le 
domaine V(A) est coupé par la parallèle à l’axe imaginaire, d’équa- 
tion A, = d \ , suivant un segment ( a 2 a" 2 ) lorsque a\ , appartient à l’inter- 
valle (X, A), et en zéro point si a K est extérieur à cet intervalle. 

Cette propriété du domaine V(A) d’être coupé par les parallèles à une 
direction suivant un segment n’appartient pas seulement à la direction 
parallèle à l’axe imaginaire, mais à toutes les directions . En effet, la 
matrice e^A a un domaine V(e^A) qui se déduit de V(A) par rotation 
d’un angle S autour de l’origine; ce nouveau domaine jouit de la propriété 
parallèlement à l’axe imaginaire, quel que soit 9 ; il en résulte que le 
domaine V (A) jouit de la propriété relativement à toutes les directions. 
Le domaine V(A) est donc convexe. 

3, Montrons que le domaine V(A) contient le spectre . Soit, en 
effet, a une valeur propre ; il existe un vecteur X, de longueur i , satis- 
faisant à 

dtX = AX, 

c’est-à-dire 

X*«X = X* AX, 
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ou encore 

a as X*ÀX = A(X, X), 

puisque 

X*aX = aX*X et X*X = (X, X) = i. 

La forme prend donc la valeur propre a, lorsque X a comme 
valeur la solution propre correspondante . Autrement dit, les valeurs 
propres de À appartiennent à V(A). Il en résulte que les valeurs du 
spectre ont des modules inférieurs à M(A) et que les parties réelles des 
valeurs du spectre sont comprises entre le minimum et le maximum 
de A* et, par suite, entre — M(A) et +M(A); de même, les parties 
imaginaires des valeurs du spectre sont comprises entre le minimum et 
le maximum de A 2 , donc entre — M(A) et -b M(A). 

Voilà tout ce que nous pouvons dire sur le domaine d’une matrice non 
normale si nous n’en connaissons que le spectre. Nous avions prévu 
que nos résultats ne seraient pas plus précis, car se donner le spectre 
d’une matrice, revient à se donner la diagonale principale de la forme 
réduite, les termes situés en dessous de cette diagonale étant arbitraires 
et influant sur le domaine. 


III. - DOMAINE DES VALEURS DE LA FORME BILINÉAIRE 
ASSOCIÉE A UN OPÉRATEUR QUELCONQUE. 

1. A un opérateur A quelconque, nous associons la forme bilinéaire 
définie par 

i,k 

Nous allons chercher le domaine W (A) du plan complexe parcouru par 
cette expression lorsque les vecteurs X et Y décrivent les sphères |X| = 1 , 

m=>- . 

Il est évident que le domaine W(A) contient le domaine V(A), 
puisque celui-ci est obtenu pour Y = 5L 

Si le domaine W(A) contient un point W 0 , il contient tout le 
cercle centré à V origine et passant par W 0 . En effet la valeur W 0 
était atteinte pour un certain couple de vecteurs, soitX 0 , Y 0 ; dans ces 
conditions, le couple X 0 , e l6 Y 0 nous donnera la valeur e ,ô W 0 ; il est clair 
qu’en faisant varier 0, nous obtiendrons tous les points du cercle. 

Mais, comme dans le paragraphe précédent, le domaine W(A) 
est connexe comme le domaine de X et Y; il en résulte qu’il est formé 
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par une couronne circulaire centrée à l’origine. Nous allons montrer que 
ce domaine contient la valeur zéro, par conséquent qu’il se réduit à un 
cercle. En effet, Y étant fixé, l’équation X'AY = 0 admet au moins une 
solution X de module i (une équation homogène à n inconnues). Le 
domaine W (A) est donc un cercle de rayon M< (A) en désignant par (A) 
le maximum de" | X'AY | lorsque |X| = | Y | = x . D’après une remarque 
faite au début de ce paragraphe, nous avons 

Mi(A)gM(À). 

Cette inégalité va être complétée par le théorème de Hellinger-Tœplitz. 
Remarquons, en passant, que si A est unitaire, le domaine W(A) est 
constitué par le cercle unité, car |X'AY|<i ( f ) et, d’autre part, les 
valeurs caractéristiques sont situées sur la circonférence unité. 


2. Théorème de Hellinger-Tœplitz. — On a toujours (A) ^ 2 M(A). 
Etudions d’abord le cas particulier où la matrice A est normale et 
établissons qu’alors M-,(A) = M(A). Les domaines V et W n’étant pas 
altérés par une transformation unitaire, nous pouvons ramener la matrice 
normale A à sa forme canonique; donc nous aurons 

X* AX = 2 a 1 x% #/, 

X'AY = 'îtXiXiyu 

La forme X*AX ayant pour domaine le plus petit polygone convexe 
contenant le spectre, nous avons 

M(A) = maximum de | \{ |,' 

atteint pour X = e t , d’indice i correspondant au maximum de | h |. 

La forme X'AY vérifie 


! X'AY i = 


2 x ' r '-r' 


< max | X ( | S | xt/t | = M(A) 1 1 x t y, |; 


et, d’après une identité classique, 

I X'AY | ^ M( A), 
M 1 (A)gM(A). 


donc 

ce qui entraîne 


(*) D’après l'inégalité de Cauchy-Schwarz. 
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Comme, d’autre part, nous avons démontré l’inégalité 


il en résulte 


Mi(À)£M(A), 

Mt( A) = M(A) pour A normale. 


20*7 


Abordons maintenant le cas général . Montrons que, pour une matrice 
quelconque, nous avons M 1 (A)<aM(À). A cet effet, décomposons la 
matrice en ses deux composantes hermitiennes 


A = Ai h- i A 2 . 

Nous avons évidemment 


M 1 (A)<M,(A,>+M 1 (A s )ï 

car la valeur absolue d’une somme est inférieure ou égale à la somme des 
valeurs absolues de ses termes; et l’on passe immédiatement aux bornes 
supérieures. Or A, est une matrice hermitienne, donc normale; d’après 
le cas particulier nous avons donc 


et de même 
Nous en déduisons 
Or, il est clair que 
et de même 
Donc, finalement, 


M i (A 1 ) = M(A 1 ) 


M 1 (A 2 ) = M(A 2 ). 


M 1 (A)gM(A,)n-M(A 2 ). 


M(A.,)< M(A) 
M(A 2 )<M(A). 


M 1 (A)^2M(A). 


Remarquons que les inégalités obtenues 

M(A)gM. l (A)^2M(A) 


ne peuvent être resserrées , car chacune des deux égalités est possible : 
M (A) = M 4 (A) pour les matrices normales, 

Mj (A) = 2 M (A) par exemple pour A = Il ° ML 
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IV. - APPLICATION AUX NORMES MATRICIELLES. 


1. Si H est une matrice hermitienne, nous désignerons par n(H) la 
plus petite des valeurs caractéristiques X t -, par m(H) la plus grande et 
parM(H)le maximum des deux quantités |m(H)| et |/i(H)|; remar- 
quons que M(H) a donc encore le sens que nous lui attribuions dans le 
paragraphe précédent : 

n(H)<: hi m( H), M t (H) = M(H) = Max [ | #»i(H), | »(H) | ]. 


Si A est une matrice non hermitienne et A* son associée, nous avons 
déjà introduit les deux matrices hermitiennes 

AA* et A* A 


et les deux formes associées, appelées normes matricielles 
X*AA*X =2|2' 


Q>ik Xi 

»'IT 

x*a*ax=2 

i k 


11 résulte de ces expressions que les deux normes sont des formes 
hermitiennes définies non négatives et même définies positives si zéro ne 
fait pas partie du spectre, c’est-à-dire si A n’est pas dégénérée; car la 
condition nécessaire et suffisante pour que AA* soit dégénérée est que A 
le soit [dét AA*= | dét A | 2 ]. 

D’après l’inégalité de Schwarz, nous avons, puisque | X | = | Y [ 1 : 


|X'AY|* = 


2*' (S"'* 7 *) 


s (2i..r )(?l? aikyk | ^ |2 


ctikfk 


= Y* A* A Y. 


Et, le vecteur Y étant déterminé, on peut choisir X de façon à avoir 
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l’égalité en prenant : 



Nous venons donc d’établir que 

|X'AY(^Y*A*AY, 


V égalité étant possible pour un choix de X dépendant du choix de Y. 
Il résulte de cette inégalité que le maximum [M^A)] 3 du premier terme 
ne peut être supérieur au maximum M(A*A) du second; choisissons 
alors Y de façon à rendre le second terme maximum, nous savons qu’il 
est possible de déterminer X de façon à obtenir l’égalité; il en résulte 
que 

[M I (A)'|*= M(A*A). 


Remarquons d’autre part que les matrices AA* et A* A étant équi- 
valentes dans le groupe unitaire, ont même spectre ; donc leurs formes 
d’Hermite, associées ont même maximum et même minimum, 

w(AA*) = m(A*A), 
n (AA*) « n (A* A), 

V (AA*) = V(A*A), 

ce qui entraîne que M(A*A) = M(AA*) et finalement : 

f Mt(A*)]*= [M 1 (A)J*= M(AA*) = M( A*A). 


JULIA 


14 



CHAPITRE VI. 


ÉQUATIONS INTÉGRALES DE FREDHOLtt A NOYAUX DÉGÉNÉRÉS 
(NOYAUX DE GOURSAT). 


1 . Avant de clore cette première Partie du cours, nous voudrions 
montrer, par un exemple particulier, la répercussion sur le domaine 
fonctionnel des propriétés de l’espace à n dimensions que nous avons 
étudiées. 

Pour préciser, les propriétés des opérateurs linéaires que nous avons 
étudiées analytiquement sous l’aspect du calcul des matrices peuvent 
s’étudier sous V aspect fonctionnel qui, une fonction 9(5) étant donnée, 
lui fait correspondre par une transformation linéaire ©(9) une fonc- 
tion f(s) = ©(9) de manière que 

^(91 -+* ?*) = ■+* ®(?i) 

et 

fé(Xcp) = X fé(cp) (X nombre quelconque). 

Nous particulariserons encore en envisageant la résolution des équa- 
tions linéaires , ou le calcul de la matrice inverse d’une matrice 
donnée, ou la détermination de l’opérateur inverse d’un opérateur donné. 

Le parallélisme se marquera nettement si nous choisissons ©(9) sous 
la forme de Fredholm 

®(?) = ?(*) — pf t) 9(0 dt, 

J a 

et si nous cherchons à faire l’inversion de cette transformation en résol- 
vant par rapport à 9 l’équation 

9(0 — 1 1 f k(s, t)y(t)dt = f($). 

J a 

Pour mettre en évidence le parallélisme avec l’inversion des trans- 
formations linéaires de l’espace E n à n dimensions, nous envisagerons 
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des noyaux du type considéré par M. Goursat ( 1 ) 

p 

k(s, t) =z^CLi(s) 
l~\ 

Nous avons déjà, dans l'Introduction, dit quelques nfots de l'équation 
intégrale de Fredholm de deuxième espèce 


(i) 


<?(*) — I* J k(*t t)<?(t)dt=z f(s). 


Nous supposons que les fonctions k(s, t) et f(s) sont connues et nous 
recherchons les fonctions cp continues et satisfaisant à cette équation. 
Nous avons insisté sur une propriété fondamentale de cette équation : sa 
linéarité; sa résolution est liée à celle de l’équation homogène associée 

r b 

(2) ?(*) — I W k(Sj t) ç(/) dl = o. 

J a 

Un rôle important sera aussi joué par V équation transposée 
(O H*) — : x f k(t, s)'i(()dt = g(s), 

et par l’équation homogène correspondante 
(2') <K«) — [J- f k(t, s) dt = o. 

a 


Fredholm a traité le problème pour des noyaux k(s , t) très généraux. 
Nous allons simplement nous occuper ici des noyaux k(s , t) dégénérés , 
c’est-à-dire tels que 

p 

*(*> *) =’£<*>(*) 
t=. I 

les fonctions ai et bi étant continues; nous supposerons aussi que la 
fonction f est continue et nous ne chercherons que les solutions <p 
continues. Le noyau dégénéré peut présenter plusieurs décompositions; 
supposons que ce soit la plus courte que nous venons d'écrire. Il en 
résulte que les fonctions ai(s) sont linéairement indépendantes , car 
dans le cas contraire, l'une d'entre elles, d P par exemple, serait une 


( 1 ) Annales de Toulouse , 1908; Bull. Soc. Math, de France , 1907. 
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combinaison linéaire des autres, soit 


a p = a 1-4- ?*«*■+.. • 

d’où 

#»— i 

*(»> 0 =2 «<(*)[*<(*) + ïi Mo]> 
< = 1 


et nous pourrions obtenir la représentation du noyau avec /? — i couples 
de fonctions, ce qui est contraire à l’hypothèse. Les fonctions a, sont 
donc linéairement indépendantes, ainsi que les fonctions b,. 

L’équation de Fredholm (i) s’écrit 




i bien 


r 

1*2 1 a ‘ ,s) f 

Si nous posons alors 


J \J£è 9(t)dt 
■]- 

= f bi(t)f(t)dl = (b h <?), 

J a 


f(S), 


bi(t)?(t)dt\ = f(s). 


produit intérieur des deux fonctions bi et <p dans V espace fonctionnel , 
l’équation devient 

p 

( 3 ) ?(*) = /(*) + 

/= i 


Il est clair que 9 sera déterminé dès que les Xi le seront. 
Reportons cette expression dans la relation définissant xi 

Xi— f bi(t)f(t)dt-hn^?Xkf bi(t)ak(t)dt . 

'f' 

En posant 

r b 

Cki — I ak( t) bi(t) dt = (a*, 6/) 

J a 

et 

fi = f b t (t)f(t)dt = (b h /), 

cette équation s’écrit 

p 

( 4 ) **=//+ 
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et nous obtenons p équations semblables en donnant à i les valeurs i, 
2 , .... p . 

Si 9 est une solution de l’équation de Fredholm (i), il est clair que 
les 9) correspondants satisfont au système d’équations (4). 

Remarquons que le système (4) peut être formé uniquement à partir 
de f et de k(s , t). Réciproquement, supposons que nous ayons une 
solution Xi, X‘ 2 , x p du système (4)- La relation (3) nous permet d’en 
déduire par (3) une fonction <p(s). Montrons que cette fonction est solu- 
tion de l’équation de Fredholm (i); en effet, 


f *(*, *)9(t)dt = f* l^a i is)b i (t)\o(t)dt=^a i (s)J^ 


bi(t) o(t)dt, 


et, puisque 9 provient de la relation (3), 

f k(s, t)y(t) dt 
^ a 

p b r p n 

= f bi ^ 


dt 


f b f I f b 

= J* bi(t)f{t)dt+^at{s)\ / bi(t)a k (t) 

i~\ a i ~ I \ i - r 1 a 

P P t P 

= 2 ) at( $ ) /*■ - + “2 a *^ **2 ckiXk 
i=l i = 1 ( kz=. l 

P P 

=2«i(*) 1 /■•+ ckiXk <• 


dt 


Or les Xk sont solutions du système (4); cette relation peut donc s’écrire 



p 

)<f(t)dt='2 à a i (i)x i , 
i - i 


soit, en utilisant de nouveau l’équation (3), 







Par conséquent, la fonction 9 ainsi obtenue est bien une solution de 
l’équation de Fredholm. 



CHAPITRE VI. 


214 

En définitive, l’équation (i) est équivalente à 

p 

(4) Xi— ft. pour i = i, 2 , ...,/> 

*=i 

et 

p 

( 3 ) ?(*) = /(*) -*- 1*2 “'(*)• 

i=i 

Nous pouvons remarquer que les solutions cp de l’équation (i) et les 
solutions Xi du système (4) se correspondent biunivoquement par les 
relations 

p 

?(*)=/(*)•+■ ^ 
t-\ 

c b 

Xi = / bi(t)y(t)dt. 

J a 

De même, l’équation (i') est équivalente à 

p 

yi—y^Cikyk — gi pour i = i, 2 , 

* = 1 

et 

*>(i) = ^(i)-+«x S.y/é/Cs). 

2. Discussion. — Nous devons introduire le déterminant du système (4) 
d’équations linéaires 

I— jjlCh — p-Câi ... — 

— |JLCi2 1— JJLC 22 ... -JJlC/,2 


— — pc tp ... I — 

Premier cas. — Si pu. a une valeur telle que le déterminant D(/x) ne 
soit pas nul, le système (4) présentera une solution unique, ainsi que le 
système transposé. L’équation (i) de Fredhoim présentera donc une 
solution <p et une seule donnée par (3); il en sera de même de l’équation 
transposée (i'). Les équations homogènes correspondantes ( 2 ) et ( 2 ') 
présenteront o pour une seule solution. 

Deuxième cas . — Supposons que pt ait une valeur telle que le déter- 
minant D(p) soit nul. Considérons alors les systèmes homogènes 


D(p) = 
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relatifs aux systèmes (4) et (4') 


p 


( 5 ) 

C ^i X k “ 0 

pour i = 1 , 2 , . 



k = 1 



et 

P 



( 5 ') 

yt-v.Vwk = 0 

pour i= 1 , 2 , . . 



k~ 1 




Ils onl le même nombre r de solutions linéairement indépendantes (J ). 
Pour que le système (4) soit possible, il faut et il suffit que le vecteur f 
de composantes (/< , . . . , f p ) soit orthogonal aux solutions de (5'), c’est- 
à-dire à r d’entre elles indépendantes 

p 

2 fiyf = ° P our ^ 2, . . 

t = I 

S’il en est ainsi, la solution générale de (4) dépend de r constantes 
arbitraires; elle est la somme d’une solution particulière de (4) et de la 
solution générale de (5). 

Avant de conclure pour l’équation de Fredholm, vérifions que la 
correspondance biunivoque entre les solutions <p de V équation homo- 
gène ( 2 ) de Fredholm et les solutions xi du système (5) conserve la 
dépendance et l’indépendance linéaire. Supposons, en effet, que nous 
ayons 

y 

f=t 

Puisque, d’autre part 

p 

?#’ = 1*2 xf'aiis), 
i - 1 


(‘) Les solutions 9 de l’équation homogène (2) et les solutions x i du système ( 5 ) se 
correspondent biunivoquement par 


P 

9 = *£*&{*), 
i = 1 


x i 



Même remarque pour les solutions de (2') au ( 5 '). 
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la relation précédente s’écrit 

p i 

ckx> ‘ l;) = °- 

i = l h= 1 

Et puisque les fonctions ai(s) sont linéairement indépendantes, ceci 
entraîne 

j 

2 C ^! / ‘ ) = 0 P 0ur «=I, 2, 

4 = 1 

c’est-à-dire 

; 

Se*X.« = o, 

4=1 

X (/> ) étant le vecteur de composantes . . . , . 

Toute relation existant entre les solutions <p de (a) existe donc entre 
les solutions X (A) de (5). Et réciproquement, car ces calculs peuvent se 
refaire en sens inverse. 

* Par conséquent, si D (/jl) = o, les équations (5) et (5 r ) présentent le 
même nombre r de solutions linéairement indépendantes ; les équations 
homogènes (2) et (2') présentent ce même nombre r de solutions linéai- 
rement indépendantes. 

L’équation ( 1 ) ne présentera de solution <p que si le système (4) 

p 

(4) *t — CktXk =/i (f = i,2, p) 

4=1 

en admet. 

Si donc on désigne par Y (l >, . . ., Y^‘> les r vecteurs solutions indé- 
pendantes du système transposé homogène 

p 

(5') /i— (*2c/*r* = 0 ’ 

*=1 

les composantes de YM étant y[ l) , . . . - yf ( 1 = 1, 2, .... /*), la condition 
nécessaire et suffisante pour l’existence de solutions de ( 4 ) est que le 
vecteur f(f { , soit orthogonal aux h vecteurs YM c’est-à-dire que 

l’on~ait 

p 

(G) 27S'’/i = ° pour l = r. 

*=i 
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Inversement, si (6) est réalisé, ( 4 ) admet une solution générale égale à 
une solution particulière augmentée de la solution générale de ( 5 ), 

Or, à Y ( ^, correspond une solution ^ (/ )($) de (2'), équation deFred- 
holm homogène transposée, par 


r 

/=! 

r b 

les conditions (6) s’écrivent alors, à cause de fi — I bi(s)f (s) ds, 


soit 

(7) (/, 4 ,U) )~ f f(s)^(s)fh=o pour 1 = 1, 2, .... /■. 


Les conditions (7) expriment que f(s) est orthogonale à toutes les 
solutions de (2'), équation homogène transposée. 

Réciproquement, on voit que les conditions nécessaires et suffisantes . 
(7) entraînent (6) auxquelles elles sont équivalentes. 

Il faut donc et il suffit que le second membre f soit orthogonal aux r 
solutions linéairement indépendantes du syslème[homogène transposé (2') 
S’il en est ainsi, la solution de (1) ne sera pas unique caria solution 
générale de (1) est la somme d’une solution particulière et dé la solution 
générale de (2), en raison de la linéarité de l’équation de Fredholm, 
mise en évidence dans l’introduction. 


3 . Conclusion. Théorème de Fredholm. — Il peut s"énoncer sans 
l’aide des déterminants. Toutefois nous mettrons entre parenthèses ce qui 
est relatif aux déterminants, et le lecteur remarquera que le théorème 
conserve tout son sens lorsqu’on ne lit pas ce qui est entre parenthèses. 

Un nombre jx étant donné, deux cas sont possibles : 

a. Ou bien l’équation de Fredholm (1) admet, quel que soit le second 
membre /, une solution et une seule <p; en particulier l’équation 
homogène n’admet que la solution o. Dans ce cas [D(jjt)^o] les 
mêmes résultats s’appliquent à l’équation transposée et à l’équation 
homogène transposée. 

b. Ou bien l’équation homogène admet un nombre r o de solutions 
linéairement indépendantes l’équation homogène transposée admet 
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le même nombre r de solutions linéairement indépendantes <p‘). La 
condition nécessaire et suffisante pour que l’équation (i) de Fredholm 
soit résoluble est que l’on ait (/, ^ U) ) = o pour i= 1,2,.. ., r; et si 
elle est résoluble sa solution générale y est égale à la somme d’une solu- 

V 

tion particulière <p w et de la solution générale^ de l’équation 

/= 1 

homogène. [Dans ce cas D(p) = 0] 

/• 

/= 1 

Les valeurs jjt qui annulent D(p), polynôme en p de degré p, sont les 
valeurs caractéristiques (ou propres) de F équation (1) ou (i') ou (2) 
ou (2'). 

4 . Remarque. — Les noyaux de Goursal se sont révélés utiles même 
pour l’étude de ï équation générale de deuxième espèce à noyau 
k(s , t) continu (et même plus généraux). Il suffit pour cela de remar- 
quer que tout noyau continu k(s, t) peut, suivant un théorème de 
Weierstrass, se développer en série uniformément convergente de 
polynômes en (5, t) ou être arbitrairement approché dans le domaine 
a<^s<b, a<t<^b, par un polynôme en (s, t ). En substituant à k(s , t) 
dans (1) un polynôme en (s, t) approché, on a une équation approchée 
de (1) dont les solutions approchent celles de (1). Or un polynôme 
en (s, t) est un noyau de Goursat, nous savons donc discuter la résolu- 
tion de l’équation approchée et trouver les solutions par ce qui précède. 
Il est possible, en prenant des approximations de k(s, t) de plus en plus 
serrées, de démontrer l’existence des solutions de (1) et d’approcher de 
plus en plus ces solutions. Nous nous bornerons à ces indications, 
renvoyant sur ce sujet aux Mémoires de M. Goursat (/oc. cit) et de 
M. Lebesgue (Bull. Soc . Math . de Fr., 1908); voir aussi Courant et 
Hilbert, Mèthoden der mathematischen Physik , Chap. 3 ]. 


(‘) Dank cette solution générale, on peut choisir une solution unique particulièrement 
intéressante en exigeant de <p la relation (9, <p(*‘) ) = 0. Les équations en ont alors un 
déterminant qui est un déterminant de Gram, lequel est 5^ d, puisque les <p(') sont indé- 
pendants. 


FIN. 
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